7月3日,月之暗面宣布了一个让我坐不住的消息:Kimi K2.7 Code正式接入GitHub Copilot。这是Copilot上线以来第一次接入开源模型,而且是一个中国模型。
不夸张地说,这件事的意义比很多人想象的要大得多。它不只是一个技术接入,而是证明了开源模型可以进入全球最大的开发者工具生态——而且是以商业化的方式。
Copilot为什么选Kimi
先看事实。Kimi K2.7 Code是6月12日发布并开源的,不到一个月就被GitHub Copilot接入了。部署在微软Azure上,采用按量计费,先推Copilot Pro、Pro+和Max订阅用户,后续扩展到Business和Enterprise。
微软的选择不是拍脑袋。K2.7相比K2.6有两个关键提升:一是在长上下文编程场景下指令遵循能力显著增强,处理跨文件跨模块任务时不会断片;二是把长程任务里程序员最头疼的「过度思考」问题大幅压住了,平均token消耗直接砍掉30%。token消耗少三成意味着什么?响应更快、成本更低、代码输出更聚焦。
还有一个细节值得注意:Anthropic刚刚发布的Fable 5安全报告中,把Kimi K2.7和Opus 4.8、GPT-5.5放在同一张桌子上做安全评估。在单一漏洞利用演示任务上,K2.7给出了和Fable 5一致的结果。这说明中国模型不只是在「便宜」这个维度上有优势。
商业上意味着什么
Kimi现在的商业化数据很能说明问题。据接近Kimi的机构人士透露,6月中旬ARR突破3亿美元,API收入已经占整体收入七成以上且持续走高。目前估值涨到了315亿美元投前。
更关键的是收入结构:API收入占七成,说明Kimi的商业化重心已经从C端对话转向开发者调用。这恰恰是Anthropic早期走过的路——开发者调用放量、API占比提升、海外付费用户增长,由模型能力迭代带动价格体系上移。Kimi正在复刻这条路,而且节奏更快。
接入Copilot意味着Kimi直接进入了全球最大的付费开发者群体。Copilot有多少付费用户?微软不公布,但业界估算在千万级别。哪怕只有一部分用户选择K2.7,按量计费的收入增量也很可观。
开源模型的时代真的来了
把视野拉大一点看,这不是Kimi一家的胜利。Airbnb用阿里的Qwen替代OpenAI驱动AI客服,问题解决时间从3小时压到6秒。Cursor的Composer 2底座是Kimi K2.5。Coinbase把GLM 5.2和Kimi K2.7设为全体工程师默认模型,AI支出直接砍半。OpenRouter平台上,中国模型周调用量已经连续多周压过美国模型——从一年前不到2%到现在的61%。
斯坦福2026年AI指数报告的核心结论就是:中美模型在能力上基本没有差距了。当性能差距被抹平,价格就成了决策的第一要素。GLM 5.2的调用价格约为Claude Opus 4.8的六分之一,DeepSeek V4 Pro比Claude Sonnet便宜7到17倍。任何一个对成本负责的CFO都得算这笔账。
微软的双面棋局
微软这步棋也很有意思。一边花25亿美元组建微软前沿公司,另一边把中国开源模型接入自家旗舰开发者工具。一方面要搞自研AI全家桶,另一方面又不想错过开源生态的红利。
本质上,微软在Copilot上走了「模型中立」路线——用户可以根据任务选择最优模型,而不是被锁死在微软自己的方案里。这对开发者是好事,对微软也是——留住用户、增加调用量、扩大生态,比死守一个模型聪明得多。
对创业者和开发者的启发
这事给我最大的感受是:AI行业的竞争逻辑变了。上半场拼的是谁的模型更强,那是OpenAI和Anthropic的时代。下半场拼的是谁能把成本和性能的平衡做到极致——而中国开源模型在这个维度上正变得越来越有竞争力。
Kimi B端负责人黄震昕最近说了句实话:今年以来所有模型厂商都在涨价,核心原因是算力成本在全球范围内上涨。但涨价的同时,Kimi还能拿到Copilot的接入资格,说明性能和价格之间找到了一个市场愿意买单的点。
对普通开发者和创业者来说,信号很明确:不要再有「只有美国模型才好用」的惯性思维了。现在是性能差距基本抹平、价格差几倍甚至十几倍的窗口期。谁先切换,谁先省钱。K2.7接入Copilot,等于微软帮你做了一次背书——中国开源模型,放在全球最大的开发者工具里,能用,好用,且划算。

Anthropic把Kimi K2.7纳入安全评估这件事本身就很说明问题。在安全测试这个维度上,中国模型已经被当成和Opus、GPT-5.5同一梯队的选手来对待了。承认对手的实力,本身就是最大的认可。
这让我想到一个问题:当模型能力差距被抹平,竞争的维度就变了。不再是「谁的模型最强」,而是「谁能在性能和成本之间找到最优解」。中国开源模型恰好踩在这个点上。但我好奇的是,当大家都便宜了,下一个竞争维度会是什么?
作为一个小白开发者,我用Copilot主要就是代码补全和解释。之前一直是默认模型,刚切了K2.7试了下,长文件的上下文理解确实比之前好,不会写着写着忘了前面的函数定义。而且响应速度快了一截。免费的还要啥自行车。
代码说话。Coinbase把Kimi当默认模型后AI支出砍半,Airbnb用Qwen替代OpenAI年省40万美元。这些不是实验室benchmark,是真实生产环境的成本数据。中国开源模型的ROI已经不需要论证了,需要论证的是为什么还没切。
技术角度说一句:K2.7能进Copilot不是偶然。Anthropic的安全测试把K2.7和Opus 4.8、GPT-5.5放一起跑,在漏洞利用任务上和Fable 5结果一致。这不是以前那种「便宜但凑合用」的定位了,是真正站到了第一梯队。token消耗少30%是实打实的工程优化,不是营销话术。