又一个大消息炸响AI圈。
蚂蚁集团正式开源了万亿参数思考模型百灵Ring-2.6-1T,这是国内首个达到万亿参数级别的思考模型开源。对于整个AI行业来说,这可能是一个值得记住的节点。
什么是"思考模型"?
在说百灵之前,先聊聊什么是"思考模型"。
传统的大模型是"快思考"——你问一个问题,它立刻给出一个答案,不管对不对都要硬着头皮答。而"思考模型"则是"慢思考":遇到复杂问题,它会先分析问题、拆解步骤、反复推敲,然后才给出答案。
这就像学生时代考试,普通学生扫一眼题目就开始写,优秀学生则会先在草稿纸上推演几步再落笔。
OpenAI的o1/o3系列、Claude的Opus 4、DeepSeek的R1,都是这个路数。它们在数学证明、代码生成、复杂推理等任务上,展现出了质的飞跃。
百灵Ring-2.6-1T的技术亮点
具体看百灵Ring-2.6-1T的参数:
- 总参数规模:近万亿(1T)级别
- 推理时激活参数:约1000亿(100B)
- 架构:MoE(混合专家)架构
采用MoE架构意味着什么?简单说就是"专业的人做专业的事"。模型被拆分成多个专家模块,每次推理只激活相关的少数专家,而不是整个模型全部参与。这让万亿参数模型的运行成本大幅下降,同时保持性能。
目前百灵Ring-2.6-1T已在Hugging Face和ModelScope同步上线,模型权重和推理代码全部开源,允许商用。
为什么这个开源很重要?
这是国内大模型开源生态的一个标志性事件。
之前国内开源的大模型,大多数是千亿参数级别的。而百灵Ring-2.6-1T是目前已知参数规模最大的开源中文思考模型,没有之一。
对于开发者和企业来说,这意味着:
- 可以在百灵的基础上做二次微调,打造垂直领域的"专家模型"
- 可以直接部署使用,无需依赖闭源API,按Token付费
- 可以深入研究万亿参数模型的训练和推理技术
阿里在开源这条路上越走越深。通义千问Qwen系列已经成为了国际开源社区的重要力量,如今蚂蚁百灵加入战局,国内开源大模型的生态正在变得越来越丰富。
竞争格局生变
百灵的开源,也让思考模型赛道更热闹了。
之前这个领域基本是OpenAI、Anthropic、DeepSeek三分天下。如今蚂蚁带着万亿参数杀进来,格局必然生变。
尤其是对于需要复杂推理能力的应用场景——代码生成、数学解题、法律分析、金融建模——一个高性能的开源思考模型,将大幅降低这些场景的AI落地门槛。
百灵能不能打?社区很快就会给出答案。

期待社区大佬基于这个训练出各种垂直模型
阿里系开源真香,Qwen打前阵,百灵接上
万亿参数开源,蚂蚁这波格局打开了
MoE架构用得好,省算力又不降性能
国内开源大模型越来越卷了,好事