腾讯突然发布Marvis,AI助手从"聊天"进入"操控"时代
今天被一条消息刷屏了。5月20日,腾讯正式推出操作系统层级的AI助手Marvis,面向Windows、Mac、安卓三端全量开放,免邀请码。
说实话,这类消息我一般先观望两天。但这次有点不一样——腾讯给它打的标签是"操作系统层级",不是"对话助手"。这两个词的区别,可能比你想象的更重要。
什么叫"操作系统层级"?
简单说就是:以前的AI助手是"长在"应用里的,你问它答,你不操作它就不动。
Marvis不一样。它能直接触达系统设置、文件管理、应用调用和硬件信息。你可以问它"我的电脑能流畅运行黑神话吗",它会感知本机硬件配置,联网查询游戏要求,然后给你判断。
调整鼠标灵敏度、关闭开机自启动项、清理冗余文件——这些以前要手动操作的事情,现在用自然语言就能搞定。这不是加了几个功能按钮,是从底层重新理解了AI助手能做什么。
跨端能力是亮点,但不算独家
Marvis支持Windows、Mac、iOS、安卓多端同账号互通。你可以在手机上直接查看电脑屏幕并实时接管,PC锁屏状态下手机仍可远程输入密码解锁操控。
但这个能力其实不算独家了。之前向日葵、ToDesk这些远程控制软件都能做类似的事。Marvis的差异在于它"不只是远程控制"——它能操作电脑上的EXE软件,也能直接在电脑上运行手机APP(比如微博、小红书),而且不抢占键盘鼠标,可以多任务并行。
这个能力来自腾讯应用宝团队四年的跨端引擎技术积累。应用宝团队和软硬件厂商有十余年的合作关系,这成了Marvis的底层支撑。
内置6个Agent协同,不是噱头
Marvis出厂时内置了6个Agent协同工作:主Agent负责统筹拆解任务,File Agent处理文件搜索、阅读、编辑、格式转换,Computer Agent负责系统运维与硬件检测,App Agent调用电脑应用,Browser Agent进行网页交互与数据抓取,Search Agent负责网络搜索与信息聚合。
你不需要自己配置工作流或编写技能脚本,装上就能用。对于普通用户来说,这点很重要——之前很多Agent产品功能很强大,但需要一定的学习成本才能上手。
在安全层面,Marvis设置了多层机制。删除文件、修改系统核心配置等敏感操作会强制触发"硬垂询",必须先给执行计划并请求确认。支付等高敏感动作必须由用户本人完成。开启隐私模式后,所有数据解析、图片识别及对话均在本地完成,完全不上云。
和微软、英特尔的合作是护城河
Marvis背后有两个关键合作:
和微软的合作聚焦系统层面。基于Microsoft Foundry on Windows端侧AI开发平台,Marvis通过WinML推理框架实现大模型在本地NPU、GPU和CPU上的优化运行。借助MCP on Windows提供的本地设备代理注册表,Marvis接入了系统级文件MCP服务,能够通过自然语言直接操作电脑文件。
和英特尔的合作聚焦芯片级推理性能。Marvis借助OpenVINO加速技术,针对端侧模型做了芯片级别的运算速度优化,整体推理性能提升20%以上。在中小尺寸模型场景中,Intel AIPC的GPU/NPU推理速度相比传统CPU可提升2到10倍。
这种和芯片厂商、系统厂商的深度绑定,不是小团队能快速复制的。
竞争格局正在改变
目前市面上的AI助手大致分三类:通用对话型(如豆包、Kimi)、工具型(如AI PPT、编程助手)和操作系统层级(如微软Copilot、苹果Apple Intelligence)。Marvis明确选择了第三类。
一位行业分析师告诉我:"用户不会只在一台设备上使用AI,手机、电脑、平板甚至车载系统都需要无缝衔接。Marvis在跨端方面的积累,是其长期竞争力的一部分。"
但问题也很现实:AI助手要走向大众,需要解决操作门槛和安全隐私门槛两个问题。Marvis的"初始多Agent+自然语言交互"策略降低了操作门槛,但用户对"AI能操控我电脑"这件事的信任建立,还需要时间。
这可能是AI助手的分水岭
我观察AI行业这几年,经历了几个阶段:
第一阶段是"玩具"——能对话,好玩,但没什么实际用处。
第二阶段是"工具"——能写文案、能做PPT,效率提升明显,但需要用户主动使用。
第三阶段是"助手"——Marvis代表的趋势:用户定目标,AI自己规划、自己执行、自己监控结果。你不需要一步步指挥,只需要说"帮我把最近一个季度的发票整理成表格",剩下的它自己搞定。
从"你问它答"到"你定目标它干活",这看起来只是技术进步了一小步,但意义完全不同。以前的AI像是工具,用得好不好取决于你会不会用它。未来的AI像是员工,你需要的是管理能力——怎么布置任务、怎么验收结果、怎么纠偏方向。
腾讯Marvis不是终点,但它代表了一个明确的方向:AI助手的竞争,正从"云端对话"走向"终端执行",从"模型参数比拼"转向"系统深度整合"。
接下来就看用户买不买单了。毕竟,再好的技术,最终还是要回到"普通人用不用得上"这个问题上来。

和微软、英特尔合作这个点很关键。AI产品最后拼的不是模型多强,而是能不能和底层系统深度整合。应用宝团队四年的跨端积累,不是随便一个小团队能追上的。
从"工具"到"助手",这个判断我认同。以前我们学软件操作,现在让AI学我们操作。未来的门槛不是"会不会用",而是"会不会布置任务"。
数据不说谎:Intel AIPC的GPU/NPU推理速度提升2-10倍,这个提升幅度不小。如果真的能普及,对整个PC生态都会有影响。
这个"系统级操控"确实有点东西。之前那些AI助手本质上就是个加了语音的搜索引擎,Marvis这个思路更像是在操作系统里装了个能理解你意图的助手。