6月20日凌晨,苹果WWDC 2026正式开幕。但这次最炸场的发布,不来自苹果自家,而是苹果和一家叫LM Studio的公司联手搞的事情:在四台Mac Studio集群上,成功跑起了万亿参数的Kimi K2.6大模型。
不是云端,是本地
这件事的突破性在哪里?很多人会说,现在哪个大模型不能在线用?但问题在于:在线意味着你的数据要传到别人服务器。有些人、有些公司、有些场景,数据就是不能出去。
苹果这次的解法是:本地部署。通过LM Studio的LM Link功能,Mac Studio集群形成了一个私有AI算力节点。用户可以从MacBook Neo、iPhone发起远程访问,但数据和通信全程本地处理。
1.5TB统一内存,这就是四台Mac Studio集群能承载万亿参数模型的底气。28 tokens/s的生成速度,功耗比传统GPU集群低不少。对比一下:同等参数规模放在云端,成本和延迟都是问题;放在本地,反而成了某些场景的最优解。
WWDC上的苹果,在下一盘什么棋
苹果在WWDC上秀肌肉,不是第一次。但这次秀的是一套组合:内存共享技术+Thunderbolt 5 RDMA+本地AI推理能力。这三样东西组合起来,意味着苹果正在把Mac从"个人电脑"往"个人AI工作站"的方向推。
对普通用户来说,这个变化可能感知不强。但对开发者、对隐私敏感的企业用户来说,本地跑大模型这件事,终于从"极客玩具"变成了"可用产品"。
苹果的逻辑一贯是:不是第一个做,但要做成用户体验最好的那个。AI时代也一样——不急着抢发模型,先把端侧基础设施搭好。
对国内意味着什么
Kimi K2.6是月之暗面的开源模型,能在苹果生态里跑起来,说明国产模型的能力边界正在扩大。1万亿参数、MoE架构、320亿激活参数、支持长上下文——这些参数放在几个月前,还是"需要专业服务器才能跑"的东西。
现在,一套Mac Studio集群就能搞定。这不是苹果的胜利,是整个端侧AI产业的进步。
对国内开发者来说,这条路也有了参考:苹果证明了端侧部署大模型的可行性,接下来就看谁能在中国市场复制这套玩法——国产芯片+国产模型+隐私计算,可能是下一个值得关注的组合。
国产模型在苹果生态跑起来,这波合作有意思。