苹果WWDC炸场：Mac跑万亿参数Kimi K2.6，本地AI时代真的来了？

AI风向标AI学习 2026-06-20 22:54:43 2阅读举报

6月20日凌晨，苹果WWDC 2026正式开幕。但这次最炸场的发布，不来自苹果自家，而是苹果和一家叫LM Studio的公司联手搞的事情：在四台Mac Studio集群上，成功跑起了万亿参数的Kimi K2.6大模型。

不是云端，是本地

这件事的突破性在哪里？很多人会说，现在哪个大模型不能在线用？但问题在于：在线意味着你的数据要传到别人服务器。有些人、有些公司、有些场景，数据就是不能出去。

苹果这次的解法是：本地部署。通过LM Studio的LM Link功能，Mac Studio集群形成了一个私有AI算力节点。用户可以从MacBook Neo、iPhone发起远程访问，但数据和通信全程本地处理。

1.5TB统一内存，这就是四台Mac Studio集群能承载万亿参数模型的底气。28 tokens/s的生成速度，功耗比传统GPU集群低不少。对比一下：同等参数规模放在云端，成本和延迟都是问题；放在本地，反而成了某些场景的最优解。

苹果在WWDC上秀肌肉，不是第一次。但这次秀的是一套组合：内存共享技术+Thunderbolt 5 RDMA+本地AI推理能力。这三样东西组合起来，意味着苹果正在把Mac从"个人电脑"往"个人AI工作站"的方向推。

对普通用户来说，这个变化可能感知不强。但对开发者、对隐私敏感的企业用户来说，本地跑大模型这件事，终于从"极客玩具"变成了"可用产品"。

苹果的逻辑一贯是：不是第一个做，但要做成用户体验最好的那个。AI时代也一样——不急着抢发模型，先把端侧基础设施搭好。

Kimi K2.6是月之暗面的开源模型，能在苹果生态里跑起来，说明国产模型的能力边界正在扩大。1万亿参数、MoE架构、320亿激活参数、支持长上下文——这些参数放在几个月前，还是"需要专业服务器才能跑"的东西。

现在，一套Mac Studio集群就能搞定。这不是苹果的胜利，是整个端侧AI产业的进步。

对国内开发者来说，这条路也有了参考：苹果证明了端侧部署大模型的可行性，接下来就看谁能在中国市场复制这套玩法——国产芯片+国产模型+隐私计算，可能是下一个值得关注的组合。

版权声明：
作者：AI风向标
链接：https://www.aiddithome.com/p/1f939f14a0d9fe.html
来源：AI学习
文章版权归作者所有，未经允许请勿转载，若此文章存在违规行为，您可以点击 “举报”。