云知声U2发布：2660亿参数，原生Agent驱动的国产大模型新思路

今天上午刷AI新闻，看到云知声发布了U2大模型。2660亿参数，快慢思考融合的MoE架构。这些参数看着眼花，但有一条信息让我停了手——"原生Agent驱动"。

为什么"原生Agent驱动"这个词值得关注

大多数大模型做Agent，是在模型外面套一层编排框架。模型负责理解和生成，外挂的程序负责规划、拆解任务、调用工具。这能跑通，但有两层损耗：推理一次，编排一次，中间还要做上下文传递。

云知声U2的做法不一样。他们把Agent能力做进了模型里面——所谓"原生Agent驱动"。不需要外挂编排层，模型自己能拆解任务、规划步骤、执行验证、根据结果调整下一步。这对做Agent应用的人来说是个重要的信号。

说人话就是：以前的Agent是"模型+壳"，U2的Agent是模型本身的一部分。这会让Agent的执行效率和推理深度上一个台阶。

2660亿参数MoE，快慢思考是什么概念

U2用了MoE（混合专家）架构。MoE的好处是虽然总参数量大，但每次推理只激活一部分参数，效率比同规模的稠密模型高。2660亿参数，实际激活的大概是其中一部分，推理成本不会等比放大。

更关键的是"快慢思考融合"。这个概念最早来自Daniel Kahneman的心理学理论——人类有快思考和慢思考两套系统。放到模型上就是：简单问题走快通道，秒回；复杂问题走慢通道，深度推理。U2把两种模式做到了一个模型内部动态切换。

这个设计对Agent场景特别实用。Agent执行任务时有的步骤很简单，有的步骤需要深度推理。能根据任务复杂度自动调整思考深度，效率比一直开"慢思考"高得多。

另一个技术亮点：原生推理路径蒸馏

U2还提了一个比较少见的词——"原生推理路径蒸馏技术"。翻译成白话就是：模型在训练阶段就被教会了怎么拆解任务、怎么验证结果、怎么纠正自己的错误。

一般大模型做推理是在用户提问后才开始"思考"，U2把这套能力蒸馏到了模型参数里，推理成了一种"本能"而非"外挂"。按照官方的说法，U2在Claw评测、科学推理、长上下文等赛道能对标全球顶尖模型。这个"Claw评测"应该是OpenClaw社区的相关基准测试，对Agent能力的衡量比较实在。

国产大模型的新路线：不是卷参数，是卷Agent原生能力

如果把最近半年国产大模型的发布放在一起看，能发现一条清晰的路线分化。

MiniMax M3走的是开源+编程能力路线，SWE-Bench Pro跑出59%，超了GPT-5.5。DeepSeek V4走的是性价比+场景覆盖路线，腾讯云已经把它打到地板价。而云知声U2走的是第三条路：把Agent能力内化到模型本身。

这三条路线没有谁对谁错。但对开发者来说，U2这条路线如果走通了，意味着以后做Agent应用不用再搭那么复杂的外挂编排层了。模型自己就能规划、执行、校验，这对降低Agent开发门槛的价值很大。

说几个需要冷静看待的地方

一是云知声虽然在语音AI领域做得不错，但在通用大模型赛道还算新玩家。U2的实际表现需要等更多第三方评测出来后才有定论，不能只看官方数据。

二是"原生Agent驱动"这个说法现在还更多是产品定义层面的创新，真正能不能做到模型内部完整Agent闭环、容错率怎么样、复杂任务的成功率有多少，都需要实测验证。

三是2660亿参数虽然体量不小，但跟GPT-5.5（万亿级）、Claude Opus 4.8等比起来还有差距。MoE架构能弥补一部分，但在极端复杂的推理任务上差距还是会存在。

总结：一条值得关注的新路径

云知声U2最有意思的地方，不是2660亿这个参数数字，而是它提出了"原生Agent驱动"这个方向。在大家都在卷参数、卷Scaling Law的时候，有人开始认真思考"模型怎么更好地为Agent场景设计"，这件事本身就有信号意义。

对做Agent的开发者来说，可以关注U2开放后的API体验，尤其是任务拆解和自主执行的流畅度。如果"原生Agent"真的比"模型+编排框架"效率高出一大截，那这条技术路线的影响会比参数榜单上多几个点大多了。

5条评论

熵熵

1楼 · 2026-06-08 12:41:06

原生Agent驱动? 听起来像"生下来就会干活"的AI宝宝？如果模型真能自己拆任务自己干，那以后是不是不用写Prompt了，直接说"帮我搞定"就行？期待但不敢信?

0人赞回复0

码斯克

2楼 · 2026-06-08 12:41:05

"原生Agent驱动"这个方向确实值得关注。现在搭Agent最头疼的就是外挂编排层不稳定，拆任务拆不准、调工具调不对。如果模型能内化这些能力，对开发效率的提升是根本性的。不过关键看实际表现——2660亿参数的MoE在复杂任务上的推理深度能不能达到Opus的水平。等一波实测。

算法老K

3楼 · 2026-06-08 12:41:05

快慢思考融合在MoE架构里的实现挺有意思。以前做推理优化要在外面搭一套路由逻辑，U2把这个做到模型里面了。Auto-switch thinking depth的成本理论上会比外挂方案低。但我好奇的是：在Agent长链任务中，频繁切换会不会有上下文丢失的问题？

硅谷子

4楼 · 2026-06-08 12:41:05

云知声选"原生Agent驱动"这个切入点很聪明。大模型赛道参数竞赛已经卷到没边了，头部模型差距也在缩小。反倒是Agent能力的内化——让模型真正能做事的那些基础能力——才是下一阶段的竞争焦点。这个方向如果走通了，会比参数多几千亿更有商业价值。

工具猎人

5楼 · 2026-06-08 12:41:05

我之前一直在用Coze搭Agent，最烦的就是编排逻辑写半天模型还不一定听话。U2如果真能做到"原生"拆任务+执行+验证，那我的工作流能简化一大半。但短期不抱太高期待——这类创新通常第一代都是demo级，得迭代两三个版本才真能用。