先说结论:DeepSeek V4正式版7月中旬上线,引入API峰谷定价,高峰时段价格翻倍。但算完账你会发现,翻倍之后依然是全球最便宜的顶级模型。
不搞虚的,直接拆。
定价怎么变的
北京时间9:00-12:00和14:00-18:00为高峰时段,价格是平峰的2倍。具体看V4-Pro:平峰输出6元/百万tokens,高峰12元。缓存命中平峰0.025元,高峰0.05元。
V4-Flash平峰输出2元,高峰4元。注意一个细节:这次不是整体涨价,平峰价格和之前永久2.5折的定价完全一致。等于在原有低价基础上,高峰期加了一倍。
腾讯云也同步发了公告,表示会跟随原厂节奏,在大模型服务平台TokenHub上同步引入峰谷定价。
为什么搞峰谷定价
答案藏在数据里。V4 Flash预览版单模型周调用量突破4.66万亿Tokens,峰值并发激增导致接口频繁超时。7月2日又出现了一次大规模性能下降,官方在回应中同步官宣了V4上线时间和峰谷定价。
说白了就是:太便宜导致用的人太多,算力扛不住了。与其限流拒绝用户,不如用价格杠杆"削峰填谷"——让价格敏感的用户把批量任务挪到晚上跑,高峰时段保障对时效性要求高的场景。
翻倍后还便宜吗
算笔硬账。V4-Pro高峰输出12元/百万tokens,约1.7美元。对比:OpenAI GPT-5.6 Sol输出30美元/百万tokens,Claude Opus 4.7约75美元/百万tokens。即使翻倍,DeepSeek V4-Pro的价格依然是GPT-5.6的1/18,Claude的1/44。
缓存命中场景更夸张:0.05元/百万tokens。如果你复用System Prompt和固定上下文,高频调用的成本几乎可以忽略不计。
V4正式版有什么提升
除了定价,V4正式版还带来了几个关键升级:默认支持100万Token上下文窗口,在Agent任务执行、数学推理和代码生成领域性能更强。技术上,DSpark推测性解码让Flash版本生成速度提升85%,DSA稀疏注意力将百万token推理计算量压缩到V3.2的27%。
一句话:更强的同时,保持便宜。只是不再是"无限便宜"。
峰谷定价意味着什么
这不是DeepSeek一家的事。它是国产大模型从"烧钱抢用户"到"精细化运营"的一个重要信号。智谱AI已经累计提价83%后调用量反而增长,豆包5月启动了商业化付费体系。行业正在从"谁更便宜"转向"谁的服务更稳"。
对开发者来说,适应峰谷定价的玩法很简单:批量推理、离线分析、模型训练这些对延迟不敏感的任务,尽量安排在非高峰时段,成本直接减半。在线服务、实时对话这些必须高峰跑的场景,多出来的几块钱对比GPT和Claude的价差,依然是白菜价。
V4正式版到底能跑多快,到时候上代码实测。
峰谷定价的本质是用市场化的方式解决算力供需矛盾。DeepSeek不是第一个遇到这个问题的,AWS的Spot实例、GCP的Preemptible VM都是同样逻辑。关键在于:平峰价没涨,高峰价翻倍后仍然便宜到离谱——这不算涨价,是精细化运营。
给大家翻译一下:如果你只是自己用、不赶时间,价格完全没变。如果你是做在线服务、高峰期必须跑,多花几块钱但仍然是GPT的五十分之一。核心建议:批量任务设个定时器,夜里跑,省钱。
从商业角度看,这是大模型从烧钱获客走向精细化变现的标志。智谱提价后调用量反增,豆包开始收费,DeepSeek搞峰谷——说明国产大模型的商业闭环正在形成。这对整个生态是好事,只会烧钱不可持续。
你真的理解峰谷定价了吗?它不是涨价,是一种时间维度上的价格歧视。同一个模型,同一份能力,只是在不同时段支付不同价格。这其实在问一个更深的问题:算力到底是公共品还是商品?
一直在用DeepSeek V4预览版写代码,坦白说性价比确实无敌。峰谷定价对我不影响——写代码本来就是深夜灵感最好,完美避开高峰时段?