5月27日凌晨,小米扔出了一颗深水炸弹。
MiMo-V2.5系列API永久降价,最高降幅达到99%。0.025元/百万tokens,买不了吃亏买不了上当,但能买到一个大模型调用。雷军本人一大早就亲自发微博喊话,欢迎开发者接入。
这波降价有多离谱
先看看数字有多夸张。
MiMo-V2.5-Pro输入缓存命中价格降至0.025元/百万tokens,对比原价1.40元,降幅98%。如果按256k-1M规格的14元原价对比,降幅直接99%。
输出端同样杀疯了——Pro版输出降至6元/百万tokens,最高降幅86%。标准版更狠,直接砍到2元,降幅93%。
还有个关键变化:这次取消了按上下文窗口长度定价的做法。以前短窗口便宜、长窗口贵,现在全拉平了。对开发者来说,不用再纠结要不要为了省钱把上下文截断这个问题。
一周内两家永久降价
小米的动作不是孤立的。
就在一周前的5月22日,DeepSeek刚宣布V4-Pro API永久降至原价的1/4,降幅75%。输入缓存命中价格0.025元/百万tokens,和小米最新定价几乎一模一样。
短短一周,两家国产大模型厂商先后选择永久降价——不是限时促销,不是季度活动,直接写在价格表里不打算改了。
如果把几家最新价格拉出来:DeepSeek V4-Pro 0.025元、MiMo-V2.5-Pro 0.025元、Qwen3 Max 3.90元、Kimi K2.6缓存命中0.07元。国产大模型的价格战,已经杀到了地板价附近。
Token消耗量才是关键
小米这次还有个隐藏大招——Token Plan计费体系大改版。
套餐价格不变,但额度容量提升5到8倍。按小米给出的95%以上缓存命中场景测算,39元Lite套餐就能跑到5亿Token以上。
这意味着什么?企业可以更激进地使用AI能力,不用再盯着Token计数器精打细算。对于需要大量调用Agent的企业来说,这可能是比单Token价格更实在的利好。
价格战背后的逻辑
大模型厂商为什么开始打价格战?
表面看是竞争加剧,深层原因是Token消耗量的爆发式增长。2026年以来,Token处理量增速惊人——按这个烧法,光靠API收费很难覆盖成本。
降价,本质上是让更多开发者用起来,扩大生态。当开发者和应用场景足够多,才能谈其他的变现方式。
对中小开发者来说,这是好事。以前调用大模型API太贵的理由,现在越来越站不住脚了。

小米这波太狠了,0.025元百万tokens,比白嫖还便宜
问题是大模型降价了,应用场景真的爆发了吗
雷军这是要把AI能力做成普惠基础设施啊
等等,DeepSeek也是这个价,谁在赔本赚吆喝
价格战最终受益的是开发者,终于可以大胆调用了