DeepSeek V4峰谷定价：AI算力进入"分时电价"时代

AI风向标Agent 2026-06-30 16:25:24 4阅读举报

6月29日深夜，不少开发者收到了DeepSeek的邮件：V4正式版7月中旬上线，同时引入峰谷定价——每天9:00-12:00和14:00-18:00，API调用价格翻倍。

什么概念？高峰期多花一倍的钱

具体来说：V4 Pro缓存命中输入平时0.025元/百万Tokens，高峰0.05元；缓存未命中输入平时3元，高峰6元；输出平时6元，高峰直接12元。V4 Flash便宜一些，缓存命中输入高峰0.04元，输出高峰4元。翻译成人话：如果你的AI应用在工作时间跑DeepSeek V4，成本就是翻倍。但如果放在凌晨、午休或周末跑，价格不变。

为什么搞这个？不是涨价，是算力不够用了

OpenRouter聚合平台的数据很说明问题：DeepSeek V4 Flash单模型周调用量突破4.66万亿tokens，连续6周登顶全球单模型调用榜。4.66万亿tokens是什么概念？相当于每天有超6600亿tokens在跑。全球没有任何一家AI公司经历过这个量级的调用压力。结果就是办公时段服务器频频超时。峰谷定价本质上是用价格杠杆分流：把能排队跑的批处理任务赶到便宜时段，把金融、代码开发这类实时业务留在高峰期享受稳定服务。

哪怕涨2倍，还是全球地板价

横向比一比就知道：V4 Pro高峰输出12元/百万tokens，约合1.74美元。而OpenAI GPT-5.5标准API输出约30美元/百万tokens，Claude Opus 4.8输出25美元/百万tokens。DeepSeek高峰期价格不到OpenAI的6%、不到Claude的7%。跟自己的首发价比（预览版首发输出24元），高峰12元也便宜了一半。所以涨价这个说法其实不准——DeepSeek把办公时段的算力从白菜价调回了白菜价的两倍，但对面卖的依然是龙虾价。

AI算力正在变成电力

这件事的价值不在价格本身，而是它标志着一个行业拐点：AI算力正在像电力一样，按时段分层计费。电力行业搞峰谷电价几十年了——白天工业用电贵，晚上便宜，工厂自然会把高能耗产线排到夜班。AI行业现在复制了这个逻辑：白天实时推理贵，晚上批处理便宜。可以预见，DeepSeek开了这个头后，国内其他大模型厂商大概率跟进。以后开发者的竞争力不只是用哪个模型，还包括怎么调度任务——高峰期推理用Flash便宜模型兜底，低谷期切Pro做深度分析。

两个配套好消息

DeepSeek也不是光涨价不办事。同步推出的DSpark推理加速框架，通过投机解码能把推理速度提升60%-85%，单位时间消耗的tokens总量减少，部分抵消涨价影响。强烈建议开发者开启prefix caching，缓存命中的输入价格只有未命中的1/120，重复prompt场景能省大钱。V4正式版本身的能力升级也值得期待——预览版的Agent能力已超过Sonnet 4.5、接近Opus 4.6非思考模式，正式版补齐商用短板后，可能会进一步缩小与海外头部闭源模型的差距。