5月初,AI大模型领域接连传来重磅消息:DeepSeek发布V4版本,Kimi K2.6在编程挑战中击败Claude Opus 4.7和GPT-5.5。中国开源模型正在逼近闭源前沿,这轮技术迭代的速度令人目不暇接。
DeepSeek V4:开源模型的规模新纪录
DeepSeek V4-Pro达到1.6万亿参数(49B活跃参数),V4-Flash为2840亿参数(13B活跃),两者都支持100万token上下文窗口。V4-Pro成为目前最大的开源模型,V4-Flash每百万token收费0.14/0.28美元,甚至低于GPT-5.4 Nano。
值得注意的是,DeepSeek V4首次将华为昇腾芯片与英伟达芯片并列写入硬件验证清单,标志着国产大模型正式摆脱对英伟达CUDA生态的依赖。字节、腾讯、阿里等头部企业近期集中采购华为昇腾芯片,国产算力底座规模化应用加速。
Kimi K2.6:编程赛道的意外黑马
Moonshot AI的Kimi K2.6在一场编程挑战中击败了Claude Opus 4.7、GPT-5.5和Gemini Pro 3.1。测试是一个滑动拼图游戏,有客观评分标准,中国开源模型包揽前四名。
当然,也有人提醒:Kimi可能只是"找到了这个特定游戏的正确策略",不代表通用编程能力的全面超越。但一个开源模型能在单任务挑战中与闭源前沿模型匹敌,这本身就是一种信号。
开源逼近前沿意味着什么
开源模型与闭源前沿的差距正在缩小,这对整个AI生态影响深远:
- 对开发者:有了更多低成本选择,API调用成本持续下降
- 对企业:可以基于开源模型做私有化部署,数据安全有保障
- 对行业:开源社区的创新速度正在倒逼闭源厂商加快迭代
当然,开源不等于免费。模型的训练成本、部署成本、运维成本仍然不低。但至少在模型层面,门槛确实在降低。

昇腾适配是好消息,国产算力终于能打通了
开源和闭源的差距在缩小,但落地能力还是关键
价格战打起来对企业是好事,选择多了
DeepSeek把价格打下来了,这才是真正的鲶鱼
编程这块还是得看实测,光看benchmark不够