过去三年,端侧AI讲了无数故事。手机厂商讲、PC厂商讲、汽车厂商讲,所有人都描绘同一个未来:AI不再住在云端,直接跑在设备上。但每次走到落地环节就卡住——模型能跑,跑不快;功能能做,做不深;演示惊艳,真拿到手里就变阉割版。
Computex 2026:黄仁勋扔了一张新牌
刚刚结束的Computex上,英伟达正式发布了RTX Spark PC处理器平台,包含高性能N1X和主流N1两个版本。3nm工艺,集成了CPU、Blackwell架构GPU和NPU,采用统一内存架构,最高支持128GB LPDDR5X内存。
说人话就是:这是一颗把AI推理能力直接焊进PC的"超级芯片"。N1X能提供180到200 TOPS的本地AI算力,支持运行70B参数的模型——之前这个级别的模型只存在于数据中心。
30多款笔记本、10多款桌面系统已经确认采用,合作名单包括联想、戴尔、惠普、华硕、微星和微软Surface。预计今年秋季出货。
端侧AI喊了三年,卡在哪了
从供给侧看,行业其实没偷懒。英特尔推出Core Ultra、AMD发布Ryzen AI、高通靠骁龙X Elite重返PC市场,NPU成了新处理器的标配关键词。Canalys数据,2024年全球AI PC出货约4800万台,占全年PC出货近20%,2025年预计超40%。
但供给的热闹没在需求侧激起水花。大多数用户买回去的AI PC,真正用到的AI功能还是那几个:会议降噪、视频美颜、文档总结。不是说这些不好,而是这些功能用去年的电脑也能跑,犯不着为了它们专门换机。
问题的根在硬件。不是"有没有AI加速",而是"加速到什么程度"。目前市面上的NPU算力普遍在40到80 TOPS,大概能跑个7B参数的轻量模型。但AI Agent时代需要本地推理的不只是"帮我写封邮件",而是"分析我这三个月所有的文档和聊天记录,找出现在最该推的项目"——这种任务轻量模型搞不定。
CUDA才是真正的杀手锏
很多人把RTX Spark跟苹果M系列、高通骁龙X Elite放在一起比参数,但参数表之外有更关键的东西:CUDA。
过去二十年,CUDA已经成为全球AI开发者的默认基础设施。PyTorch、TensorRT、llama.cpp这些主流AI工具的第一适配平台都是CUDA,全球绝大多数AI模型的训练和推理管线都建立在CUDA之上。把原本属于数据中心的能力下放到消费级PC,这才是RTX Spark真正和其他方案拉开差距的地方。
高通的NPU算力在纸面上不低,但它依赖QNN框架,和主流AI开发者生态之间隔着一道不小的鸿沟。苹果M系列在端侧AI的能效比是行业标杆,可惜跑的是macOS,不在Windows生态里。
对整个Windows生态而言,RTX Spark带来的意义是:终于有一个方案,既能在本地跑大模型,又能无缝衔接开发者已经用了二十年的CUDA工具链。
价格和现实:不算便宜,但不影响方向
摩根士丹利调研预计,搭载N1X的产品售价可能达到2899美元,约合2万元人民币。标准版N1起售价约1799美元。这不是面向大众消费市场的产品,和天风国际分析师郭明錤的判断一致:未来两年出货约1000万台,主要面向AI开发者、内容创作者和对本地AI算力有需求的重度用户。
与此同时,HBM需求增长正在推高DRAM价格,惠普透露部分产品中内存占整机成本已接近35%。RTX Spark依赖大容量统一内存,成本压力真实存在。
但价格贵不贵和方向对不对是两回事。2013年第一代Retina MacBook Pro卖2199美元,当时也被说贵,但高分辨率屏幕后来成了标配。RTX Spark的意义不在于立刻让每个人买得起AI PC,而在于它证明了一件事:端侧AI的硬件天花板是可以打破的。
从"为人的电脑"到"为AI的电脑"
RTX Spark带来的最大变化,可能不是跑分,而是PC设计逻辑的改写。
过去三十年,PC是围绕"人怎么操作软件"来设计的。CPU多强、内存多大、显卡多快,都是为了让人用得更爽。但AI时代,电脑不再只是给人用的工具,它还要自己跑——跑Agent、跑推理、跑多模态理解。这台电脑上可能同时运行五六个Agent,每个都在后台做不同的事。
黄仁勋在Computex上说了一句话值得注意:AI就是新的用户界面。你不再需要打开软件、找到功能、执行操作,而是直接告诉电脑你想干嘛,AI自己去调度工具完成。
这种场景下,NPU算力、内存带宽、统一内存架构这些硬件指标,会从"锦上添花"变成"基础能力"。RTX Spark能不能卖好是市场的事,但它标记了一个方向:端侧AI的故事,终于不是在云端讲的了。
看到2899美元的价格我默默关掉了浏览器。不过话说回来,如果能本地跑Agent帮我自动写周报和回邮件,我愿意让公司给我配一台?
最打动我的是黄仁勋那句AI就是新的用户界面。现在每次想用AI做点复杂的活,得在好几个工具之间来回切,累死了。如果Agent能直接接管工具链,我负责说要什么,它负责怎么做,那才是真正的效率革命。
一台2万块的笔记本,里面跑着5个Agent帮你在后台干活,而你只用说帮我搞定……这不就是打工人的终极梦想吗?
128GB统一内存在笔记本上确实激进,但Agent时代内存就是命门。你想想一个Agent要加载模型+上下文+工具链+沙箱环境,32GB根本不够用。硬件设计从人用变成AI用,这个逻辑是对的。
CUDA下放到消费级PC这件事,比N1X的200TOPS更值得关注。AI开发者不需要重新学一套SDK,直接能用PyTorch和TensorRT,这才是真正的端侧AI可用。高通的QNN框架走了这么多年,开发者生态始终没起来,就是差在这一步。