6月8日,云知声发布了新大模型U2。参数约3000亿,MoE架构,激活参数只有总参数的十分之一。不搞虚的,先说结论:这是一条和主流大厂完全不同的路。
原生Agent,不是外挂
现在市面上大多数"Agent"是怎么做的?在通用大模型上套一层Harness框架,让它去调工具、执行任务。能用,但不够稳定——有时候任务拆解不合理,有时候工具调用出错,有时候跑着跑着就忘了自己要干嘛。
云知声U2的思路是反过来的:从模型架构层面就为Agent能力设计。任务拆解、工具调用、自主决策这些能力,不是在模型上面打补丁,而是原生内建在模型里。U2在SWE-Bench Verified上拿了75分,在Claw-Eval上拿了76.9分。3000亿参数做到这个水平,效率很高。
不拼参数拼密度
U2的总参数量约3000亿,但MoE架构下激活参数只有约十分之一。说人话:推理的时候不需要把所有参数都跑一遍,用哪块激活哪块。推理成本锚定在激活参数规模上,高并发场景下成本优势非常明显。
另一个有意思的点:云知声强调"高智能密度"和"高Token价值"。简单说,就是让每个Token承载更多信息量,用更少的Token完成更复杂的任务。这不是堆参数堆出来的,而是靠数据提纯和训练策略优化出来的。
实测案例:让U2分析2026年5月大宗商品走势,结合地缘政治和供需数据,它在一两分钟内生成了一篇超过5000字、带数据表格的专业分析报告。做俄罗斯方块小游戏、生成新产品发布倒数页面、自动写周报文档——这些任务它都能端到端完成。
有场景的公司做AI,路线不一样
云知声和纯大模型创业公司最大的区别:它有落地的行业场景。智慧医疗产品在近450家医院部署,智慧交通覆盖多个城市地铁和机场,AIoT"芯片+模型"方案服务智能家居和汽车。2025年大模型相关收入6.1亿,同比增长1076%。
这意味着U2不是实验室里的论文模型,而是有真实业务验证的。从"做语音的科技公司"到"原生Agent大模型公司",云知声花了14年完成这个转型。现在发布U2,更像是技术能力积累到一定程度后的自然溢出。
对行业意味着什么
U2代表了一种新范式:不做通用聊天模型的内卷,而是在Agent这个细分方向上做到极致。"小参数、强能力、少Token、低算力"这条路如果走通了,对企业级部署来说是个好消息——不用非得买几千张H100才能跑得动。
当然,75分的SWE-Bench和GPT-5.5还有距离。但考虑到U2的参数规模和成本,这个性价比是有竞争力的。2026年,AI行业的竞争正在从"谁参数大"转向"谁能真正在场景里干活"。云知声U2在这条路上迈出了有意思的一步。
让它做俄罗斯方块游戏它还真做出来了……我当年写俄罗斯方块写了一周,现在AI几十秒搞定。这行业还能不能给人留点面子了?
云知声?就是那个做语音的吗?它居然也开始做大模型了???? 我是不是也要转型了 ?
最让我在意的是大模型收入6.1亿、同比涨1076%。这说明AI在医疗、交通这些垂直场景里真的开始赚钱了,不是烧钱做Demo。
"原生Agent"这个提法很有意思。不是在通用模型上外挂Agent框架,而是从架构层面就为任务执行设计。这条路如果能规模化,企业部署AI的门槛会大幅降低。
SWE-Bench 75分,3000亿参数做到这个水平,效率确实可以。但"原生Agent"到底是不是营销话术,关键看实际交付的稳定性。能稳定跑通100个复杂任务不翻车,才算真的过关。