文心5.1预训练成本降至业界6%,百度这次真把大模型价格打下来了

诸葛亮AI学习 2026-05-11 09:26:39 4阅读 举报

5月的AI圈真是热闹,前脚GPT-5.5刚全量开放,后脚百度就扔出一颗深水炸弹。

文心5.1:预训练成本只要别人的6%

百度刚刚发布的文心大模型5.1,用了一项叫"多维弹性预训练"的自研技术。结果就是:同等规模下,预训练成本只有业界同行的约6%。这什么概念?别人烧100块,百度只烧6块。

参数总量压缩到约800B,是前代的1/3,但部分能力已经能媲美DeepSeek-V4-Pro。更狠的是,它直接登上了LMArena搜索榜,国内第一、全球第四——而且是唯一上榜的国产模型。

技术突破背后的逻辑

百度这次的核心创新是"多维弹性预训练"。听起来玄乎,简单说就是:让模型学会"偷懒"——在处理不同任务时,只激活最相关的参数模块,而不是全量运转。就像人类工作时分轻重缓急,精力用在刀刃上。

这个思路其实跟MoE(混合专家)架构有相通之处,但百度做了一些定制化优化,让模型在中文场景下特别能打。

为什么这件事值得关注?

大模型竞争到今天,比的不只是谁更强,还要比谁更省。算力成本是大模型公司最大的包袱,如果能用更低的成本达到同等效果,就能腾出更多资源做别的事——比如降价抢市场、加大研发投入、或者单纯提高利润率。

百度现在已经在千帆模型广场和文心一言官网同步上线了5.1版本。实际效果怎么样,建议大家自己去试试。国产模型的进步速度,确实有点超出预期。

对行业的影响

文心5.1的发布,给国内大模型竞争又添了一把火。DeepSeek、Kimi、智谱GLM都在卷,现在百度也下场了。对用户来说是好事——竞争越充分,产品的性价比就越高。

但对投资人来说可能有点纠结:模型能力在提升,为什么各家大模型公司的股价最近还是跌多涨少?这个问题,可能要等商业化数据说话。

版权声明:
作者:诸葛亮
链接:https://www.aiddithome.com/p/ae2ad531376c2.html
来源:AI学习
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
5条评论
姜子牙
1楼 · 10小时前

一直在用文心一言,感觉5.1的响应速度明显快了

栗子同学
2楼 · 10小时前

国产大模型进步速度太快了,去年还在追GPT-4,今年已经能在某些榜单上跟它掰手腕

Buffett
3楼 · 10小时前

百度这波有点东西,但还是要看实际使用体验,榜单成绩不等于好用

阿段.skill
4楼 · 10小时前

6%这个数字有点夸张,有懂行的说说这数据靠谱吗

陆小凤
5楼 · 10小时前

文心5.1这个预训练成本控制确实牛,6%是什么概念,降价空间太大了