6月17日,昆仑万维把天工升级到了3.1。乍一看只是一次版本号迭代,但我读完整份更新日志后的感受是:AI工具正在从"生成一个漂亮Demo"转向"交付一个完整产品",而天工3.1可能是今年到目前为止最认真对待这个问题的产品。
这次更新的核心是两个东西——Skywork Design(设计画布)和Dynamic Workflows(动态多Agent工作流)。一个解决"复杂需求怎么管理",一个解决"大规模任务怎么执行"。我分开聊。
从3轮到40轮:为什么Demo不等于产品
先看一个数据:天工3.0上线一个月,超级智能体收入增长了3倍。但更值得关注的是用户行为——深度用户在单个项目上的平均交互轮数超过40轮。
40轮是什么概念?大多数人用AI工具,3轮就结束了。第一轮提需求,第二轮微调,第三轮不满意就放弃了。但天工的深度用户不是来问答的,是来建造的。围绕同一个网站项目反复打磨:改配色、调结构、加页面、推倒重来。很多项目横跨多次登录才逐步成形。
这说明一个问题:AI工具的价值不在第一轮,而在第4轮到第40轮之间。第1-3轮出来的是Demo,第4-40轮出来的才是产品。天工3.1就是为这群人做的。
Skywork Design:对话框装不下的事,铺在画布上
当你和AI对话到第15轮的时候,你大概已经记不清第3轮说的是什么了。对话框适合说清一件事,但不适合看清一件事。管理十几个页面的配色、字体、跳转逻辑,在线性对话里就像在便签纸上画建筑图纸。
Skywork Design把这个过程搬到了一张无限制延展的画布上。用户可以建官网整站、App原型、后台Dashboard,Agent在画布上生成所有页面,每一轮的修改都在可视化空间里呈现。支持上传品牌手册让AI提炼设计规范,统一所有页面的视觉风格。
完成后可以导出为网页、PPT、Figma分层文件或zip包交付开发。不是只能截个图发朋友圈,是真的能落地的设计。对话框是草稿纸,画布才是专业工作台。
Dynamic Workflows:100个Agent同时干活
另一个重头戏是Dynamic Workflows。当任务规模大到单一Agent逐轮推进效率撑不住的时候——比如批量生成上百个产品页、全站文案统一改版、代码库全量排查——这套系统会先把任务自动拆解,再调度数十到上百个子Agent并行执行。
关键设计有两点。一是分工+验证:部分Agent负责干活,另一部分专门复核纠错,交叉核对后才输出结果。大规模任务最怕的是错了还不知道,有专门的纠错Agent盯着,失误在交付前就被拦截了。二是断点续跑:进度持续保存,中断后从断点继续,跨多天的大型项目不用重来。
这和Claude上个月推出的Design和Dynamic Workflows功能在同一个方向上,但天工3.1一次两个都上了,而且是国内海外同步。
为什么这件事值得关注
今年上半年AI行业有个明显的趋势:从"能说"转向"能做"。GPT-5会写代码但不会部署,Claude能设计但不会交付。用户越来越需要一个从调研、设计、执行到汇报的全链条工具。
天工3.1的野心就在这:调研用天工对话,设计用Skywork Design画布,批量执行用Dynamic Workflows,回传天工生成网页和PPT——一条完整的"从需求到交付"流水线。对于小团队和独立开发者来说,这种整合是有实际价值的。
当然要客观地说:昆仑万维的营收体量和字节、阿里不在一个量级,天工的用户规模也远不及豆包和通义。但在"AI工具从Demo走向产品"这个方向上,天工3.1的产品思路是目前最清晰的之一。
总结
天工3.1不是在比谁的模型更强,而是在回答一个更根本的问题:AI工具怎么才能真正帮人把活干完?画布和Agent军团的组合,至少给出了一个方向。
第1轮到第3轮,出来的是Demo。第4轮到第40轮,出来的才是产品。现在有人帮你铺好了中间那段路。

这个40轮的数据很真实。我用天工搭过一个产品官网,前10轮都在试配色和布局,第20轮才开始满意。画布上线之后确实比在对话框里翻历史记录强太多了。
百人Agent军团的思路是对的。单个Agent做100件事,第37件出了问题很难发现。专门派Agent复核Agent,这个交叉验证机制比单纯堆算力聪明。
昆仑万维这步棋有意思。不跟字节阿里拼模型参数,而是从"交付"这个环节切入。小团队确实需要这种从需求到上线的全链条工具,比雇一个UI+前端划算多了。
本质上是AI工具从"内容生成"转向"项目管理"。画布+工作流的组合,其实是在给AI赋予项目经理的职能。这个方向如果跑通了,影响的不只是设计行业。
我说要一个健康管理App,它给我生成了一堆荧光绿的页面,审美确实还有提升空间 ? 不过画布迭代确实方便,改了色调之后舒服多了。