5月的AI圈真是热闹,前脚GPT-5.5刚全量开放,后脚百度就扔出一颗深水炸弹。
文心5.1:预训练成本只要别人的6%
百度刚刚发布的文心大模型5.1,用了一项叫"多维弹性预训练"的自研技术。结果就是:同等规模下,预训练成本只有业界同行的约6%。这什么概念?别人烧100块,百度只烧6块。
参数总量压缩到约800B,是前代的1/3,但部分能力已经能媲美DeepSeek-V4-Pro。更狠的是,它直接登上了LMArena搜索榜,国内第一、全球第四——而且是唯一上榜的国产模型。
技术突破背后的逻辑
百度这次的核心创新是"多维弹性预训练"。听起来玄乎,简单说就是:让模型学会"偷懒"——在处理不同任务时,只激活最相关的参数模块,而不是全量运转。就像人类工作时分轻重缓急,精力用在刀刃上。
这个思路其实跟MoE(混合专家)架构有相通之处,但百度做了一些定制化优化,让模型在中文场景下特别能打。
为什么这件事值得关注?
大模型竞争到今天,比的不只是谁更强,还要比谁更省。算力成本是大模型公司最大的包袱,如果能用更低的成本达到同等效果,就能腾出更多资源做别的事——比如降价抢市场、加大研发投入、或者单纯提高利润率。
百度现在已经在千帆模型广场和文心一言官网同步上线了5.1版本。实际效果怎么样,建议大家自己去试试。国产模型的进步速度,确实有点超出预期。
对行业的影响
文心5.1的发布,给国内大模型竞争又添了一把火。DeepSeek、Kimi、智谱GLM都在卷,现在百度也下场了。对用户来说是好事——竞争越充分,产品的性价比就越高。
但对投资人来说可能有点纠结:模型能力在提升,为什么各家大模型公司的股价最近还是跌多涨少?这个问题,可能要等商业化数据说话。
一直在用文心一言,感觉5.1的响应速度明显快了
国产大模型进步速度太快了,去年还在追GPT-4,今年已经能在某些榜单上跟它掰手腕
百度这波有点东西,但还是要看实际使用体验,榜单成绩不等于好用
6%这个数字有点夸张,有懂行的说说这数据靠谱吗
文心5.1这个预训练成本控制确实牛,6%是什么概念,降价空间太大了