国产芯片第一次训出1.6万亿参数大模型,英伟达的护城河开始漏水了

AI搞钱研究所AI学习 2026-06-07 22:56:11 4阅读 举报

6月5日,深圳发布甩了一个重磅消息:深圳河套学院联合哈工大(深圳)、深圳市大数据研究院和华为团队,用昇腾910C国产AI算力集群,成功完成了DeepSeek-V4-Pro的全参数后训练。这个模型总参数1.6万亿,训练全程1500多步,一次中断和报错都没发生。

这件事的含金量,不在芯片本身

很多人看到"国产芯片训大模型",第一反应是"性能比英伟达差远了吧"。确实,昇腾910C的推理性能大约是英伟达H100的60%。但这件事的意义不在跑分,在于打通了"能不能训"这扇门。

过去国产芯片只能做推理,相当于用现成模型回答问题。全参数后训练是另一个维度的事——同时调整1.6万亿个参数,让模型学会反思、纠错、对齐人类指令。计算量和通信量是推理的几十倍。之前业内普遍认为国产芯片根本扛不住这种规模的训练,现在昇腾910C用事实把这层天花板捅穿了。

三个工程突破,没一个是花架子

这次能成靠的是实打实的工程能力。第一个叫"显存拼图":1.6万亿参数不可能塞进任何单张卡,团队把模型拆成无数小块,精确分配到千卡集群的每一张卡上,哪张卡负责哪部分参数、什么时候交换数据,都算得清清楚楚。

第二个是"负载均衡":DeepSeek-V4-Pro用的是MoE混合专家架构,训练时要所有"专家"同时学习。团队专门优化了调度算法,解决了有的专家忙死、有的闲死的堵车问题。

第三个最朴实也最难:1500多步训练全程不掉链。大模型训练最怕跑了好几天突然崩掉,所有时间算力打水漂。这次背后是一整套全链路监控和容错体系。最终模型算力利用率超过30%,关键算子效率提升14%,达到工业级标准。

为什么要关注这件事

第一,产业链的连锁反应马上就来。美国对高端AI芯片出口管制一直在加码,DeepSeek V3当初训练用的是2048块英伟达H800。现在昇腾910C证明能训1.6万亿参数模型,意味着国内大模型厂商有了一个不需要看美国脸色的B计划。百度、阿里、字节都在加速昇腾适配,这不是选不选的问题,是供应链安全的问题。

第二,训练成本会下来。据公开信息,昇腾910C的价格大约是英伟达H100的1/3。虽然单卡性能差一些,但用更多卡堆上去,总成本可能更低。这对AI创业公司来说意义重大,大模型训练的准入门槛在降低。

第三,人才培养是最被低估的价值。深圳这个项目已经培养了42名学生,让他们真刀真枪跑过万亿级模型的全流程。这些人未来会是中国AI自主化的核心力量。

当然还有几道坎

软件生态依然是最大短板。英伟达的CUDA生态积累了十几年,昇腾的CANN生态还在追赶。这次为了适配DeepSeek,华为团队重写了20%底层算子才跑通。另外,这次只是后训练,不是从头预训练。预训练的难度和工程复杂度还要再翻几倍。

还有一个现实问题:昇腾910C用的是中芯国际7nm工艺,产能有限。真要到大规模部署阶段,产能能不能跟上是个问号。

值得盯的信号

这种从零到一的突破往往意味着产业链上会出现新机会。国产算力平台的云服务商、AI训练框架的开发者、昇腾生态的ISV,都可能在接下来一两年吃到红利。每个新技术突破背后都藏着赚钱机会,关键是你能不能比别人早一步看到。这次,我觉得是时候认真盯着国产算力这条线了。

版权声明:
作者:AI搞钱研究所
链接:https://www.aiddithome.com/p/404d124ce5bb2.html
来源:AI学习
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
5条评论
Prompt工程师小林
1楼 · 3小时前

最让我在意的是第三点——培养42个学生。这些人真刀真枪跑过万亿级训练,比看100篇论文都有用。中国AI最大短板是工程人才,这个项目在补这个缺。

AI摸鱼大王
2楼 · 3小时前

说人话就是:以后我们用的国产大模型也可以完全靠国产芯片训练了,不用再看英伟达脸色。这对我们这些用AI干活的打工人来说,意味着成本可能更低、选择可能更多。好事。

硅格拉底
3楼 · 3小时前

能训出来和能训好是两回事。你真的觉得用1/3价格、60%性能的芯片堆出来的模型,能和英伟达集群训出来的比吗?真正的考验不是跑通,是效率。

安利君
4楼 · 3小时前

补充一个信息:百度上个月也宣布用昆仑芯训出了文心5.1主要版本。国产芯片训练大模型不是华为一家的事了,趋势已经形成。建议关注昇腾产业链的上市公司。

算法老K
5楼 · 3小时前

MFU超过30%这个数字才是真干货。在千卡集群上训MoE模型能跑出30%算力利用率,说明CANN的算子优化已经到了一定水平。不过重写20%底层算子才跑通,软件栈的差距还是很大。CUDA的护城河不止是硬件。