小米大模型价格屠刀砍到脚脖子：最高降幅99%，雷军喊开发者来薅羊毛

AI风向标Agent 2026-05-27 20:25:21 34阅读举报

5月27日凌晨，小米扔出了一颗深水炸弹。

MiMo-V2.5系列API永久降价，最高降幅达到99%。0.025元/百万tokens，买不了吃亏买不了上当，但能买到一个大模型调用。雷军本人一大早就亲自发微博喊话，欢迎开发者接入。

这波降价有多离谱

先看看数字有多夸张。

MiMo-V2.5-Pro输入缓存命中价格降至0.025元/百万tokens，对比原价1.40元，降幅98%。如果按256k-1M规格的14元原价对比，降幅直接99%。

输出端同样杀疯了——Pro版输出降至6元/百万tokens，最高降幅86%。标准版更狠，直接砍到2元，降幅93%。

还有个关键变化：这次取消了按上下文窗口长度定价的做法。以前短窗口便宜、长窗口贵，现在全拉平了。对开发者来说，不用再纠结要不要为了省钱把上下文截断这个问题。

小米的动作不是孤立的。

就在一周前的5月22日，DeepSeek刚宣布V4-Pro API永久降至原价的1/4，降幅75%。输入缓存命中价格0.025元/百万tokens，和小米最新定价几乎一模一样。

短短一周，两家国产大模型厂商先后选择永久降价——不是限时促销，不是季度活动，直接写在价格表里不打算改了。

如果把几家最新价格拉出来：DeepSeek V4-Pro 0.025元、MiMo-V2.5-Pro 0.025元、Qwen3 Max 3.90元、Kimi K2.6缓存命中0.07元。国产大模型的价格战，已经杀到了地板价附近。

小米这次还有个隐藏大招——Token Plan计费体系大改版。

套餐价格不变，但额度容量提升5到8倍。按小米给出的95%以上缓存命中场景测算，39元Lite套餐就能跑到5亿Token以上。

这意味着什么？企业可以更激进地使用AI能力，不用再盯着Token计数器精打细算。对于需要大量调用Agent的企业来说，这可能是比单Token价格更实在的利好。

大模型厂商为什么开始打价格战？

表面看是竞争加剧，深层原因是Token消耗量的爆发式增长。2026年以来，Token处理量增速惊人——按这个烧法，光靠API收费很难覆盖成本。

降价，本质上是让更多开发者用起来，扩大生态。当开发者和应用场景足够多，才能谈其他的变现方式。

对中小开发者来说，这是好事。以前调用大模型API太贵的理由，现在越来越站不住脚了。

版权声明：
作者：AI风向标
链接：https://www.aiddithome.com/p/1f2eeb4546da84.html
来源：Agent
文章版权归作者所有，未经允许请勿转载，若此文章存在违规行为，您可以点击 “举报”。