今天刷到一条消息,让我愣了好几秒。
百度真的把AI助手做成了「超级执行」工具
在今天(5月13日)的Create 2026开发者大会上,百度正式发布了DuMate移动端App。官方给它的定位很有意思——「一句话干活」,意思是用户说一句话,AI帮你把事情办了,直接出结果。
不是那种「我给你几个建议,你自己看着办」的模式,而是真正的执行层介入。你说「帮我把这份报告做成PPT」,它就给你生成一份完整的PPT;你说「分析下竞品数据」,它就给你跑代码、出图表、写结论。
这种「想法到结果」的闭环,正是这波AI应用竞争的核心战场。
技术指标有点猛
光说功能可能有点虚,我们看数据。
5月8日,DuMate同时登顶PinchBench和DeepResearch两大国际智能体评测基准榜首。在PinchBench的23个真实工作场景、147个任务测试中,DuMate以93.3%和93.2%的总成绩包揽前两名,超越了Anthropic的89.0%和OpenAI的91.6%。
这是什么概念?PinchBench是目前业界公认最能体现Agent真实工作能力的评测基准,考的不是你对话有多流畅,而是你能不能把事情办完、办对。
DuMate胜出的关键在于它的「端云协同Harness架构」——简单说就是,轻量任务本地处理保护隐私,复杂推理上云完成,系统自动判断,用户不用操心切换。
月增速114.72%,凭什么?
更让人意外的是市场表现。在最新一期的AI产品榜单中,DuMate以114.72%的月访问量增速登顶龙虾增速榜,同时也是增速榜前十中唯一实现三位数增长的产品。以116万月访问量跻身总榜前三。
同期增速榜前十产品里,大部分都在下滑,只有两款正增长。
增长逻辑其实很朴素——门槛够低。一个70岁、零编程经验的长白山野生动物摄影师,用一句日常口语指令,让DuMate自动完成了超过100TB野外监控视频的动物画面识别、分类归档与监测日志生成。全程没碰代码。
这个案例说明什么?当AI的执行能力足够强,普通人的使用场景会被彻底打开。
移动端的意义:打破空间限制
之前DuMate是桌面工具,今天移动端上线后,核心突破是实现了与PC端的远程实时互通——你在地铁上用手机下的指令,回家打开电脑,任务已经执行完毕。
这意味着AI助手从「桌面专属」变成了「随身执行」,工作半径从8小时办公室扩展到7×24小时全天候。
对打工人来说,这个变化挺实在的:通勤路上交代任务,到公司直接拿结果,中间不用盯着手机看进度。
竞争格局在变
DuMate的定位很有意思——它不是百度单独推的一个AI聊天工具,而是整合了百度搜索AI、秒哒(无代码应用搭建)、伐谋(智能分析)、百科等多个能力的「统一入口」。
这个策略和OpenAI的GPTs、Anthropic的Artifacts有些相似,但执行层更彻底——不是给你一堆工具让你自己组合,而是直接替你干活。
当「执行力」成为评判AI助手的核心标准,竞争的维度就从「对话体验」转向「任务完成率」。DuMate的登顶说明,这个方向可能真的戳中了用户的需求。
AI超级执行时代,可能比我们想象的来得更快。

月增速114%,增速榜唯一三位数,这个数据有点夸张了
一句话干活?老板听到这个估计要乐疯,以后交代任务更方便了
70岁摄影师那个案例挺接地气的,说明这东西真能让普通人用起来
PinchBench 93.3%这个成绩说实话有点东西,把Anthropic和OpenAI都压下去了,国产模型这次确实支棱起来了
这个「执行力」的标准提得挺好,之前大家都在卷对话体验,现在终于有人把焦点放到「能不能把事办完」上了