腾讯突然发布Marvis，AI助手从"聊天"进入"操控"时代

今天被一条消息刷屏了。5月20日，腾讯正式推出操作系统层级的AI助手Marvis，面向Windows、Mac、安卓三端全量开放，免邀请码。

说实话，这类消息我一般先观望两天。但这次有点不一样——腾讯给它打的标签是"操作系统层级"，不是"对话助手"。这两个词的区别，可能比你想象的更重要。

什么叫"操作系统层级"？

简单说就是：以前的AI助手是"长在"应用里的，你问它答，你不操作它就不动。

Marvis不一样。它能直接触达系统设置、文件管理、应用调用和硬件信息。你可以问它"我的电脑能流畅运行黑神话吗"，它会感知本机硬件配置，联网查询游戏要求，然后给你判断。

调整鼠标灵敏度、关闭开机自启动项、清理冗余文件——这些以前要手动操作的事情，现在用自然语言就能搞定。这不是加了几个功能按钮，是从底层重新理解了AI助手能做什么。

跨端能力是亮点，但不算独家

Marvis支持Windows、Mac、iOS、安卓多端同账号互通。你可以在手机上直接查看电脑屏幕并实时接管，PC锁屏状态下手机仍可远程输入密码解锁操控。

但这个能力其实不算独家了。之前向日葵、ToDesk这些远程控制软件都能做类似的事。Marvis的差异在于它"不只是远程控制"——它能操作电脑上的EXE软件，也能直接在电脑上运行手机APP（比如微博、小红书），而且不抢占键盘鼠标，可以多任务并行。

这个能力来自腾讯应用宝团队四年的跨端引擎技术积累。应用宝团队和软硬件厂商有十余年的合作关系，这成了Marvis的底层支撑。

内置6个Agent协同，不是噱头

Marvis出厂时内置了6个Agent协同工作：主Agent负责统筹拆解任务，File Agent处理文件搜索、阅读、编辑、格式转换，Computer Agent负责系统运维与硬件检测，App Agent调用电脑应用，Browser Agent进行网页交互与数据抓取，Search Agent负责网络搜索与信息聚合。

你不需要自己配置工作流或编写技能脚本，装上就能用。对于普通用户来说，这点很重要——之前很多Agent产品功能很强大，但需要一定的学习成本才能上手。

在安全层面，Marvis设置了多层机制。删除文件、修改系统核心配置等敏感操作会强制触发"硬垂询"，必须先给执行计划并请求确认。支付等高敏感动作必须由用户本人完成。开启隐私模式后，所有数据解析、图片识别及对话均在本地完成，完全不上云。

和微软、英特尔的合作是护城河

Marvis背后有两个关键合作：

和微软的合作聚焦系统层面。基于Microsoft Foundry on Windows端侧AI开发平台，Marvis通过WinML推理框架实现大模型在本地NPU、GPU和CPU上的优化运行。借助MCP on Windows提供的本地设备代理注册表，Marvis接入了系统级文件MCP服务，能够通过自然语言直接操作电脑文件。

和英特尔的合作聚焦芯片级推理性能。Marvis借助OpenVINO加速技术，针对端侧模型做了芯片级别的运算速度优化，整体推理性能提升20%以上。在中小尺寸模型场景中，Intel AIPC的GPU/NPU推理速度相比传统CPU可提升2到10倍。

这种和芯片厂商、系统厂商的深度绑定，不是小团队能快速复制的。

竞争格局正在改变

目前市面上的AI助手大致分三类：通用对话型（如豆包、Kimi）、工具型（如AI PPT、编程助手）和操作系统层级（如微软Copilot、苹果Apple Intelligence）。Marvis明确选择了第三类。

一位行业分析师告诉我："用户不会只在一台设备上使用AI，手机、电脑、平板甚至车载系统都需要无缝衔接。Marvis在跨端方面的积累，是其长期竞争力的一部分。"

但问题也很现实：AI助手要走向大众，需要解决操作门槛和安全隐私门槛两个问题。Marvis的"初始多Agent+自然语言交互"策略降低了操作门槛，但用户对"AI能操控我电脑"这件事的信任建立，还需要时间。

这可能是AI助手的分水岭

我观察AI行业这几年，经历了几个阶段：

第一阶段是"玩具"——能对话，好玩，但没什么实际用处。

第二阶段是"工具"——能写文案、能做PPT，效率提升明显，但需要用户主动使用。

第三阶段是"助手"——Marvis代表的趋势：用户定目标，AI自己规划、自己执行、自己监控结果。你不需要一步步指挥，只需要说"帮我把最近一个季度的发票整理成表格"，剩下的它自己搞定。

从"你问它答"到"你定目标它干活"，这看起来只是技术进步了一小步，但意义完全不同。以前的AI像是工具，用得好不好取决于你会不会用它。未来的AI像是员工，你需要的是管理能力——怎么布置任务、怎么验收结果、怎么纠偏方向。

腾讯Marvis不是终点，但它代表了一个明确的方向：AI助手的竞争，正从"云端对话"走向"终端执行"，从"模型参数比拼"转向"系统深度整合"。

接下来就看用户买不买单了。毕竟，再好的技术，最终还是要回到"普通人用不用得上"这个问题上来。

4条评论

码斯克

1楼 · 2026-05-22 20:25:49

和微软、英特尔合作这个点很关键。AI产品最后拼的不是模型多强，而是能不能和底层系统深度整合。应用宝团队四年的跨端积累，不是随便一个小团队能追上的。

0人赞回复0

硅谷子

2楼 · 2026-05-22 20:25:49

从"工具"到"助手"，这个判断我认同。以前我们学软件操作，现在让AI学我们操作。未来的门槛不是"会不会用"，而是"会不会布置任务"。

诸葛量

3楼 · 2026-05-22 20:25:49

数据不说谎：Intel AIPC的GPU/NPU推理速度提升2-10倍，这个提升幅度不小。如果真的能普及，对整个PC生态都会有影响。

熵熵

4楼 · 2026-05-22 20:25:38

这个"系统级操控"确实有点东西。之前那些AI助手本质上就是个加了语音的搜索引擎，Marvis这个思路更像是在操作系统里装了个能理解你意图的助手。

腾讯突然发布Marvis，AI助手从"聊天"进入"操控"时代