6月2日台北COMPUTEX,黄仁勋发布了一套叫NVIDIA Agent Toolkit的东西。大多数人关注的是宇树合作、H2 Plus机器人,但我花了两天翻完文档之后,结论变了:这套工具包才是老黄这次真正想讲的故事。
先说结论:英伟达在给Agent铺底座
过去一年,搞AI Agent的人都在抱怨同一个问题:模型很强,但落地很碎。你得自己搭框架、选模型、搞安全、写技能库,每一层都是体力活。NVIDIA Agent Toolkit做的事很简单——把这四层全部包了。
四层架构:NemoClaw(Agent蓝图框架)、Nemotron(Agent专用模型)、OpenShell(安全运行时)、CUDA-X Agent Skills(技能库)。从模型训练到安全部署全链路打通,而且已经有ServiceNow、SAP、Snowflake在用了。
这不是一个"又来了一个新框架"的故事。这是一个基础设施提供商在下注:Agent将是一个足够大的市场,值得铺一整层底座。
拆解一下技术栈
NemoClaw是核心框架,提供了预构建的Agent蓝图——客服、IT运维、财务分析、供应链管理,覆盖了企业高频场景。每个蓝图带完整的任务规划、工具调用、记忆管理和多轮对话能力。你只需要注入领域知识,不用从零搭。
Nemotron模型值得单独说。它不是通用大模型,是专门为Agent场景优化的。在ToolBench上的工具调用准确率94.7%,超过了同尺寸的GPT-4o-mini和Claude 3.5 Haiku。而且它在多步推理连贯性和异常处理逻辑上做了专项训练——这两点恰恰是Agent落地最大的坑。
最被低估的是OpenShell。AI Agent在企业环境用的最大障碍不是能力不够,是安全问题。谁敢让AI直接访问企业数据库?OpenShell提供了沙箱隔离、权限管控、行为审计和回滚机制,还支持"人在回路"——关键决策自动升级给人类审批。这个设计很务实。
老黄的算盘
为什么要关注这套工具包?不是因为它技术多牛——Agent框架现在遍地都是。是因为英伟达的玩法不一样:Agent跑得越多,需要的算力越多,英伟达的GPU卖得越多。这是一个完美的正循环。
而企业客户吃这套。ServiceNow用Agent Toolkit做IT运维自动化,SAP做供应链管理,Snowflake做数据分析。这些企业软件巨头的需求是什么?不是炫技,是稳定、安全、可审计的Agent。英伟达给了他们一个"买现成的"选项,省去了自己从零搭建的一切头疼。
对中小开发者来说意味着什么?以前做企业级Agent要自己搞定安全、权限、审计,现在直接套OpenShell就行。CUDA-X Skills库还能像搭积木一样组合技能模块。门槛降低了,但这套东西毕竟是英伟达生态的——你得跑在N卡上。
最后:Agent不再是玩具了
2026年上半年的趋势已经很清楚了:参数竞赛退潮,Agent生态上位。微软有Scout,腾讯有ADP4.0,字节有扣子3.0,阿里开放了Agent生态。现在英伟达从底层基础设施切入,把Agent当成和云计算一样的基础服务来铺。
对开发者来说,这是个好时代——你不用再为"怎么让Agent安全地访问数据库"这种问题熬夜了。但坏消息是:Agent赛道正在变成巨头的游戏。留给小团队的时间窗口,可能比想象中短得多。

Nemotron在ToolBench上94.7%的准确率意义很大。目前很多Agent翻车不是因为"不够聪明",而是"叫了错误的工具"。工具调用准确率每提升1%,实际用户体验可能是10%的飞跃。
所以以后搞Agent开发要英伟达全家桶了?GPU+Nemotron+NemoClaw+OpenShell...老黄这算盘珠子都崩到我脸上了 ?
ServiceNow、SAP、Snowflake都入了,说明企业市场已经认可了Agent=新SaaS基础设施这个逻辑。对做B端AI创业的人来说,现在考虑的不是"要不要做Agent",而是"你的Agent跑在谁的基建上"。选对底座比选对模型更重要。
老K说得对。我最近在给客户搭Agent,最大的痛点就是安全那层。客户CTO一问"你的Agent怎么保证不越权",大部分开源方案确实没法交代。OpenShell如果能解决这个,哪怕绑N卡也认了。
英伟达这套打法很像当年CUDA的路径:先铺生态底座,让开发者习惯了,算力需求自然就跟上了。Agent Toolkit的布局逻辑和CUDA如出一辙——生态锁定的威力比任何专利都可怕。