天工3.1：AI从Demo机器变成交付工具，昆仑万维在下一盘什么棋？

6月17日，昆仑万维把天工升级到了3.1。乍一看只是一次版本号迭代，但我读完整份更新日志后的感受是：AI工具正在从"生成一个漂亮Demo"转向"交付一个完整产品"，而天工3.1可能是今年到目前为止最认真对待这个问题的产品。

这次更新的核心是两个东西——Skywork Design（设计画布）和Dynamic Workflows（动态多Agent工作流）。一个解决"复杂需求怎么管理"，一个解决"大规模任务怎么执行"。我分开聊。

从3轮到40轮：为什么Demo不等于产品

先看一个数据：天工3.0上线一个月，超级智能体收入增长了3倍。但更值得关注的是用户行为——深度用户在单个项目上的平均交互轮数超过40轮。

40轮是什么概念？大多数人用AI工具，3轮就结束了。第一轮提需求，第二轮微调，第三轮不满意就放弃了。但天工的深度用户不是来问答的，是来建造的。围绕同一个网站项目反复打磨：改配色、调结构、加页面、推倒重来。很多项目横跨多次登录才逐步成形。

这说明一个问题：AI工具的价值不在第一轮，而在第4轮到第40轮之间。第1-3轮出来的是Demo，第4-40轮出来的才是产品。天工3.1就是为这群人做的。

当你和AI对话到第15轮的时候，你大概已经记不清第3轮说的是什么了。对话框适合说清一件事，但不适合看清一件事。管理十几个页面的配色、字体、跳转逻辑，在线性对话里就像在便签纸上画建筑图纸。

Skywork Design把这个过程搬到了一张无限制延展的画布上。用户可以建官网整站、App原型、后台Dashboard，Agent在画布上生成所有页面，每一轮的修改都在可视化空间里呈现。支持上传品牌手册让AI提炼设计规范，统一所有页面的视觉风格。

完成后可以导出为网页、PPT、Figma分层文件或zip包交付开发。不是只能截个图发朋友圈，是真的能落地的设计。对话框是草稿纸，画布才是专业工作台。

另一个重头戏是Dynamic Workflows。当任务规模大到单一Agent逐轮推进效率撑不住的时候——比如批量生成上百个产品页、全站文案统一改版、代码库全量排查——这套系统会先把任务自动拆解，再调度数十到上百个子Agent并行执行。

关键设计有两点。一是分工+验证：部分Agent负责干活，另一部分专门复核纠错，交叉核对后才输出结果。大规模任务最怕的是错了还不知道，有专门的纠错Agent盯着，失误在交付前就被拦截了。二是断点续跑：进度持续保存，中断后从断点继续，跨多天的大型项目不用重来。

这和Claude上个月推出的Design和Dynamic Workflows功能在同一个方向上，但天工3.1一次两个都上了，而且是国内海外同步。

今年上半年AI行业有个明显的趋势：从"能说"转向"能做"。GPT-5会写代码但不会部署，Claude能设计但不会交付。用户越来越需要一个从调研、设计、执行到汇报的全链条工具。

天工3.1的野心就在这：调研用天工对话，设计用Skywork Design画布，批量执行用Dynamic Workflows，回传天工生成网页和PPT——一条完整的"从需求到交付"流水线。对于小团队和独立开发者来说，这种整合是有实际价值的。

当然要客观地说：昆仑万维的营收体量和字节、阿里不在一个量级，天工的用户规模也远不及豆包和通义。但在"AI工具从Demo走向产品"这个方向上，天工3.1的产品思路是目前最清晰的之一。

天工3.1不是在比谁的模型更强，而是在回答一个更根本的问题：AI工具怎么才能真正帮人把活干完？画布和Agent军团的组合，至少给出了一个方向。

第1轮到第3轮，出来的是Demo。第4轮到第40轮，出来的才是产品。现在有人帮你铺好了中间那段路。

5条评论

1楼 · 13小时前

这个40轮的数据很真实。我用天工搭过一个产品官网，前10轮都在试配色和布局，第20轮才开始满意。画布上线之后确实比在对话框里翻历史记录强太多了。

0人赞回复0

2楼 · 13小时前

百人Agent军团的思路是对的。单个Agent做100件事，第37件出了问题很难发现。专门派Agent复核Agent，这个交叉验证机制比单纯堆算力聪明。

3楼 · 13小时前

昆仑万维这步棋有意思。不跟字节阿里拼模型参数，而是从"交付"这个环节切入。小团队确实需要这种从需求到上线的全链条工具，比雇一个UI+前端划算多了。

4楼 · 13小时前

本质上是AI工具从"内容生成"转向"项目管理"。画布+工作流的组合，其实是在给AI赋予项目经理的职能。这个方向如果跑通了，影响的不只是设计行业。

5楼 · 13小时前

我说要一个健康管理App，它给我生成了一堆荧光绿的页面，审美确实还有提升空间 ? 不过画布迭代确实方便，改了色调之后舒服多了。