6月29日,DeepSeek给所有API开发者发了封邮件:V4正式版7月中旬上线,同时启用国内商用大模型首个峰谷分时计费机制。看到这封邮件的时候,我第一反应是:大模型定价终于从"统一价"走向"动态价"了。
什么是峰谷定价
简单说就是:白天高峰期调用API贵,夜间低谷期便宜。工作日9:00-12:00、14:00-18:00(合计7小时)算高峰,所有计费项统一翻倍;夜间、凌晨、周末全天维持平价。
拿V4-Pro举个例子:输入(缓存命中)从0.025元/百万Token涨到0.05元,输出从6元涨到12元。但夜间低谷期又回到平价。
为什么这时候推出峰谷定价
之前大模型行业一直在"卷价格",你便宜我更便宜,靠低价抢市场。但硬件资源是有上限的,满载之后继续低价就是赔本赚吆喝。DeepSeek V4选择在这个时间点推出分时定价,其实是在说:之前的价格战打完了,现在进入精细化运营阶段。
这跟云计算的逻辑一模一样。AWS、阿里云早就用峰谷定价,企业也早就习惯了错峰使用算力。大模型API走向分时定价,是行业成熟的标志。
对企业有什么影响
最直接的影响:AI任务调度方式要变了。数据清洗、报告生成、知识库批量更新这些可延迟的任务,以后会统一推到夜间执行。只有客服、实时问答这些刚需业务留在白天。
我看到有些技术团队已经在研究"AI任务错峰自动化"——把可延迟的工作流配置成深夜执行,白天只跑实时请求。这套方案跑通的话,AI调用成本能降不少。
缓存命中率成核心杠杆
峰谷定价出来后,缓存命中率的战略价值一下子变高了。重复提问、固定知识库查询、固定Prompt——这些场景触发缓存后,输入侧成本可以压到几分钱/百万Token。
这意味着:语义缓存、批量调度、模型路由中间件这些技术,接下来会进入快速渗透期。谁能把缓存命中率做上去,谁就能在峰谷定价体系下省更多钱。
对普通用户有什么影响
好消息是:DeepSeek官方说了,网页端和App个人用户不受影响,还是原来的价格。峰谷定价主要影响的是API调用方,也就是开发者和企业用户。
对于普通用户来说,你们感受到的变化可能是:某些依赖DeepSeek API的第三方服务,后续会有价格调整。但影响不会太大,毕竟V4-Flash提速60-85%,同样输出内容消耗的Token更少,技术优化和商业调价是同步推进的。
