6月6日,字节跳动旗下AI Agent平台扣子(Coze)3.0正式上线。我花了半天时间把新功能和开源仓库都过了一遍——这不是一个简单的版本号升级,这是字节对AI Agent生态的一次全面亮剑。
多人多Agent协作:告别"单打独斗"
扣子3.0最让人眼前一亮的功能,是多人多Agent协作。以前的Agent基本是单兵作战,一个Agent处理一个任务。现在3.0支持多个Agent同时协作,每个Agent各管一摊,共享上下文、自动分配任务。
说个具体场景:一个市场调研项目,可以有"数据收集Agent"负责爬竞品信息、"分析Agent"做数据处理和洞察提取、"报告Agent"生成最终文档。三个Agent并行干活,人只需在关键节点拍板。这背后是任务编排引擎和上下文共享机制在支撑,不是简单地把几个Agent串起来。
从单人Agent到多Agent协作,这一步的跨越意义在于:AI开始从"个人效率工具"向"团队生产力平台"转变。一个能协调团队工作的Agent系统,才真正有资格被叫做超级App的底座。
行业技能包:不是Prompt模板,是完整解决方案
另一个亮眼的功能是行业技能包。扣子3.0内置了金融、自媒体、医疗、法律、科研等垂直领域的预置技能包。注意,这些不是简单的prompt模板,而是包含领域知识库、工具集成、工作流定义的完整解决方案。
比如金融技能包,可以直接接入股票数据API、财报数据库、新闻源,Agent能自动跟踪自选股、生成晨报、分析市场情绪。自媒体技能包则覆盖内容选题、文案生成、多平台发布、数据复盘的全流程。
这个设计思路很务实。过去很多Agent平台的"行业方案"就是一个换皮prompt,用户拿回去发现根本跑不通。扣子3.0直接把领域数据源和工具链打包好了,降低了从0到1的启动成本。
开放生态:Claude和Codex一键接入
更值得关注的是第三方Agent的一键接入。扣子3.0支持直接调用Claude Code、Codex CLI、OpenClaw等外部Agent的能力。这意味着开发者不需要在多个平台切换,在扣子一个界面里,就能同时调度字节自研的Agent和OpenAI、Anthropic的顶级模型。
这和OpenAI的GPTs "封闭花园"形成了鲜明对比。字节选择了一条更开放的路:不是把用户锁在自己的生态里,而是做一个"Agent的Agent",让最强的模型都来为扣子生态服务。这种策略在C端不一定讨巧,但在开发者群体中会很有吸引力。
同时扣子3.0的GitHub仓库coze-studio已经开源,21K星标、3K fork、66位贡献者,社区活跃度相当高。字节显然想把扣子打造成"Agent操作系统",不只自己做应用,更要让开发者基于扣子构建自己的Agent生态。
本土化是护城河,但挑战也不小
对国内开发者来说,扣子3.0最实在的优势是本土化。原生支持中文语境、国内数据源(微信公众号、微博、抖音)、国内合规要求。相比GPTs主要面向英文用户,扣子在国内市场的体验明显更优。字节的流量优势——抖音、今日头条、飞书的用户基数——为扣子推广提供了天然渠道。
但挑战同样明显。多Agent协作的稳定性、复杂任务分配的合理性、长会话上下文的连贯性,这些都需要在实际使用中大规模验证。生态竞争也很激烈:OpenAI的GPTs有数百万用户,Meta的Business Agent背靠WhatsApp 20亿用户,开源社区有OpenClaw、OpenJarvis等明星项目。扣子要在红海中杀出重围,光靠字节的流量优势还不够。
总结
2026年被很多行业观察者称为"AI Agent元年"。从阿里千问全面开放品牌Agent、腾讯发布效率智能体工具集,到字节扣子3.0上线——中国三大互联网巨头在Agent入口上的布局已经全面铺开。
扣子3.0的开放策略、多Agent协作能力、以及本土化的场景深度,让它在这个赛道上有独特的身位。但能不能从"功能领先"走到"生态领先",还需要看后续的开发者运营和真实场景落地。这个可能会改变游戏规则,但现在下定论还太早,值得持续关注。

作为打工人我只关心一件事:这玩意儿能不能帮我把周报月报季度总结全自动搞定?多个Agent协作听起来很美,但如果上手门槛太高就劝退了?
Agent开会互相协作……那要是它们意见不合怎么办?会不会也开始互相推锅「这个bug不是你负责的吗」?
行业技能包这个设计挺实在的。之前很多所谓的「行业方案」就是套个prompt模板,用户回去发现数据源都没接。扣子直接把API和知识库打包好,降低了试错成本。金融和自媒体这两个技能包我最感兴趣,改天搭一个跑跑看。
分析很到位。扣子3.0最值得关注的是「多Agent协作」这件事——从单兵到团队作战,背后不只是任务编排,更是Agent间上下文共享和冲突消解。这个技术门槛不低。阿里千问走品牌Agent开放路线,腾讯走深耕微信场景,字节走开发者生态。三条路没有对错,关键看谁的开发者先跑出千万级应用。
GitHub 21K星标确实说明开发者买账。不过我比较关心多Agent协作的实际稳定性。之前试过几个类似的平台,复杂任务一跑就各种超时和上下文丢失。扣子3.0能解决这个才算真正有生产力。