这周我花了两天时间,把市面上新冒出来的国产桌面Agent产品挨个摸了一遍。结论先说:不是一家两家,是15款本土Codex级产品在同一时间窗口集中上线。这不是巧合。
15款同发,背后是基础设施到位的信号
过去半年我一直关注桌面Agent赛道,之前基本上是OpenAI Codex一家独大,再加一个Cursor。国内虽然有零星产品,但要么能力太弱,要么体验太粗糙。6月下旬这一波完全不同——连续两周内,15款具备Codex级能力的国产Agent产品扎堆上线。
有做代码生成和本地文件操作的,有专攻浏览器自动化的,有做办公场景RPA+AI的,还有几个面向企业级DevOps的。技术底座基本都接入了国内主流大模型:豆包2.1 Pro、DeepSeek V3.2、通义千问、智谱GLM等。
为什么现在集中爆发?我分析三个原因:一是大模型能力到了Agent落地的临界点,国产模型在代码生成和工具调用上已经足够用了;二是桌面操作系统层面的权限管控逐步开放,Agent操作本地文件不再那么麻烦;三是豆包专业版的出现给了整个行业一个信号——C端Agent市场是真实存在的。
几个让我眼前一亮的产品
具体不点名了,但我测过的几款里,有一个做「桌面文件智能管家」的让我印象很深:你给它一个文件夹,它能自动分类、去重、提取关键信息,还能按照你的偏好生成整理方案。这跟豆包Agent的思路有点像,但它更聚焦文件管理这个垂直场景。
还有一个做「浏览器自动化Agent」的,能帮你自动填表、批量抓取网页数据、定时监控价格变化。我用它比价买了个鼠标,省了二十块。不算多,但这种「AI替你跑腿」的体验,用一次就回不去了。
相比之下,有些产品还比较粗糙——界面像十年前的软件,操作逻辑需要适应。但整体水平提升很快,大概相当于2025年底Codex早期版本的水平。
跟美国比还差什么?
实话实说,差距主要在三点:一是长任务稳定性,Codex能连续跑几个小时不崩,国产产品很多中途会出问题;二是代码理解深度,复杂工程级代码的重构能力还有差距;三是生态集成,Codex已经接入了大量开发工具链,国产产品还停留在单体工具阶段。
但速度确实快。美国从第一款Codex级产品到形成生态大概用了两年,中国从零到15款集中在几个月内发生。这个速度跟当年移动互联网的爆发节奏很像。
对普通人的影响
如果你不是开发者,这波Agent爆发对你意味着什么?很简单:以后会有越来越多的AI工具能帮你操作电脑。整理文件、填写表单、比价购物、自动生成报告——这些以前需要手动干的事,以后说句话就完了。
竞争激烈也意味着价格会越来越友好。豆包68元已经开了个头,后面只会更卷。
这个工具我试了一圈,结论是:国产桌面Agent已经从「能不能用」阶段进入「好不好用」阶段。关注这个赛道,2026年下半年会更精彩。

从商业角度看,这波Agent爆发的核心驱动力不是技术突破,是豆包2.1 Pro把Agent推理成本打下来了。基础设施便宜了,创业公司才敢冲。每个新工具背后都是机会。
代码层面说一句:国产Agent现在基本是「能跑但不可靠」阶段。像Codex那种18小时连续运行的稳定性,国内还做不到。不过方向没毛病,再给半年。
你真的觉得15款桌面Agent同时上线是好事吗?也许只是看到了风口都想挤进去,但有多少是真正有价值的?再想想。
笑死,我试了一个国产Agent让它帮我整理桌面,结果它把我的所有文件重命名成了「新建文件夹(1)」「新建文件夹(2)」……AI翻车现场+1 ?
15款同发这个密度确实吓人。我上个月还在吐槽国内没有能打的桌面Agent,一个月就被打脸了。不过长任务稳定性确实还是硬伤,我测了其中3款,跑超过30分钟就各种问题。