6月29日深夜,不少开发者收到了DeepSeek的邮件:V4正式版7月中旬上线,同时引入峰谷定价——每天9:00-12:00和14:00-18:00,API调用价格翻倍。
什么概念?高峰期多花一倍的钱
具体来说:V4 Pro缓存命中输入平时0.025元/百万Tokens,高峰0.05元;缓存未命中输入平时3元,高峰6元;输出平时6元,高峰直接12元。V4 Flash便宜一些,缓存命中输入高峰0.04元,输出高峰4元。翻译成人话:如果你的AI应用在工作时间跑DeepSeek V4,成本就是翻倍。但如果放在凌晨、午休或周末跑,价格不变。
为什么搞这个?不是涨价,是算力不够用了
OpenRouter聚合平台的数据很说明问题:DeepSeek V4 Flash单模型周调用量突破4.66万亿tokens,连续6周登顶全球单模型调用榜。4.66万亿tokens是什么概念?相当于每天有超6600亿tokens在跑。全球没有任何一家AI公司经历过这个量级的调用压力。结果就是办公时段服务器频频超时。峰谷定价本质上是用价格杠杆分流:把能排队跑的批处理任务赶到便宜时段,把金融、代码开发这类实时业务留在高峰期享受稳定服务。
哪怕涨2倍,还是全球地板价
横向比一比就知道:V4 Pro高峰输出12元/百万tokens,约合1.74美元。而OpenAI GPT-5.5标准API输出约30美元/百万tokens,Claude Opus 4.8输出25美元/百万tokens。DeepSeek高峰期价格不到OpenAI的6%、不到Claude的7%。跟自己的首发价比(预览版首发输出24元),高峰12元也便宜了一半。所以涨价这个说法其实不准——DeepSeek把办公时段的算力从白菜价调回了白菜价的两倍,但对面卖的依然是龙虾价。
AI算力正在变成电力
这件事的价值不在价格本身,而是它标志着一个行业拐点:AI算力正在像电力一样,按时段分层计费。电力行业搞峰谷电价几十年了——白天工业用电贵,晚上便宜,工厂自然会把高能耗产线排到夜班。AI行业现在复制了这个逻辑:白天实时推理贵,晚上批处理便宜。可以预见,DeepSeek开了这个头后,国内其他大模型厂商大概率跟进。以后开发者的竞争力不只是用哪个模型,还包括怎么调度任务——高峰期推理用Flash便宜模型兜底,低谷期切Pro做深度分析。
两个配套好消息
DeepSeek也不是光涨价不办事。同步推出的DSpark推理加速框架,通过投机解码能把推理速度提升60%-85%,单位时间消耗的tokens总量减少,部分抵消涨价影响。强烈建议开发者开启prefix caching,缓存命中的输入价格只有未命中的1/120,重复prompt场景能省大钱。V4正式版本身的能力升级也值得期待——预览版的Agent能力已超过Sonnet 4.5、接近Opus 4.6非思考模式,正式版补齐商用短板后,可能会进一步缩小与海外头部闭源模型的差距。
总结
DeepSeek V4峰谷定价,与其说是涨价,不如说是AI行业走向成熟的标志。算力不再统一一口价,Token越来越像电费——按需、按时、按质付费。对开发者来说,这既是成本压力,也是技术升级的契机。谁能先把任务调度玩明白,谁就能在AI算力的分时电价时代占便宜。

这事儿有意思。之前就遇到高峰期调用DeepSeek超时的问题,当时还以为是网络问题,原来是算力被挤爆了。峰谷定价虽然多花钱,但至少高峰期能稳住了。
我已经开始把批处理任务改到凌晨跑了。成本砍一半,还能避开拥堵,这波峰谷定价其实是在逼我们学会任务调度——提前步入AI时代的电力思维。
峰谷定价的本质是稀缺资源的市场化配置。DeepSeek V4 Flash周调用4.66万亿tokens,已经不是技术问题而是经济学问题了。Token正在变成一种大宗商品,定价权从模型能力转向算力调度能力。
AI也开始分时段收费了?是不是以后凌晨三点跑代码最省钱?那我是不是得变成夜猫子……算了反正我本来就是。
提醒一下各位还在犹豫的:峰谷定价其实是个赚钱信号。以后做AI应用,任务调度能力就是成本优势。谁能把批处理排到谷时段,谁就能用别人一半的推理成本跑同样的业务。这就是新的护城河。