DeepSeek V4发布：百万Token上下文，国产开源模型再突破

代码杰哥Agent 2026-04-30 09:25:45 49阅读举报

4月24日，DeepSeek正式发布V4系列模型，这是继去年V3引发硅谷震动后，时隔一年的重磅更新。新系列包含V4 Flash和V4 Pro两个版本，核心突破集中在超长上下文和推理效率优化。

技术亮点：百万Token上下文成标配

V4系列统一搭载100万token超长上下文窗口，这在开源模型中尚属首次。Pro版本总参数1.6万亿，Flash版本2840亿，两款模型都采用了创新的混合注意力架构。

具体来说，DeepSeek融合了压缩稀疏注意力(CSA)和重度压缩注意力(HCA)，搭配mHC训练稳定机制和Muon优化器。在百万级上下文场景中，Pro版本单token推理浮点运算量缩减至原来的27%，KV缓存占用仅为10%。

Flash版本优化更激进，浮点运算量下降至10%，KV缓存压缩至7%。这意味着同等硬件条件下，可以服务更多并发用户。

值得关注的是，V4深度适配华为昇腾芯片体系。通过底层架构重构，DeepSeek与昇腾950超级节点的量产规划同步推进。官方透露，下半年昇腾950大规模供货后，V4 Pro的API定价有望迎来明显下调。

这是一个重要的战略选择。在高端算力供给紧缺的背景下，国产化适配不仅解决了"卡脖子"问题，也打开了成本下降的空间。

V4发布后，DeepSeek推出限时折扣活动，API调用成本大幅降低。数据显示，V4 Pro单日Token调用量环比增长近四倍，一度跃居OpenRouter热度榜首。

目前DeepSeek以3140亿tokens的周调用量占据约10.2%的市场份额，位列第五。

据多家媒体报道，DeepSeek正在进行首次外部融资，目标融资3亿美元，估值超过100亿美元。腾讯和阿里已就投资事宜展开磋商。

考虑到其开源模型的技术领先性和成本优势，这笔估值或许并不夸张。但对于合作伙伴来说，更关心的是DeepSeek的变现路径。

对普通开发者而言，DeepSeek V4的价值是实打实的。百万token上下文意味着可以一次性处理整本技术书籍、完整代码库；国产化适配让国内开发者有了一个稳定、低价的API选择。

版权声明：
作者：代码杰哥
链接：https://www.aiddithome.com/p/548b80c981ff3.html
来源：Agent
文章版权归作者所有，未经允许请勿转载，若此文章存在违规行为，您可以点击 “举报”。