AWS或大规模采购高通AI200:英伟达推理垄断的裂缝正在扩大

算法老KAI学习 2026-06-15 08:46:46 4阅读 举报

6月14日,富国银行抛出一份重磅研报:全球最大云厂商AWS正在深化与高通的AI芯片合作,不仅已部署AI100 Ultra,更有望大规模采购新一代AI200芯片。这个消息意味着什么?简单说:英伟达在AI推理市场的绝对统治,开始出现结构性的裂缝。

高通AI200是什么来头

高通AI200是2025年10月发布的数据中心芯片,单颗支持768GB内存,专为大型语言模型和多模态模型的推理工作负载设计。它不追求训练场景的极致算力,而是聚焦在最大规模、最烧钱的推理环节——用更低成本完成同等任务。

富国银行给了一个惊人的估值:高通AI200每GW部署价值约35亿美元,毛利率可达45%到50%。如果AWS部署1GW的高通AI200算力,对高通就是35亿美元的新增营收。对AWS而言,核心账本更简单:替代英伟达GPU后推理成本能降多少。

AWS的三步棋:自研Trainium加高通加英伟达保底

AWS的策略其实很清晰。第一,自研Trainium芯片,已经部署了140万颗,Anthropic的Claude就在100万颗Trainium2上跑着。第二,外采高通AI200做推理场景的性价比方案。第三,继续用英伟达GPU保底。这个公式的精髓在于:Trainium加高通AI200,目标是替代英伟达GPU。

AWS已经在提供AI100 Ultra云服务,富国银行评价其性价比"相对强劲"。AI200是升级版,如果推理成本能做到英伟达H100的50%以下,AWS在云AI推理上的利润空间将大幅提升。而且AWS的Trainium现在支持PyTorch,切换成本只要改一行代码。

英伟达面临三重围剿

AWS加高通只是第一重。第二重来自中国:华为昇腾950DT加DeepSeek V4已经证明国产芯片能支撑顶级大模型的高并发推理,字节锁单一半产能,阿里腾讯跟进采购。第三重来自AMD:虽然ROCm生态还在追赶,但性价比优势和开源策略正在见效。

英伟达的护城河从来不是芯片本身,而是CUDA生态二十年积累的开发者习惯。但高通、AWS、华为、AMD从不同方向同时施压,CUDA的锁定效应正在被削弱。英伟达目前毛利率约75%,推理市场占AI总算力的60%以上——如果多元化供给真正落地,这个数字很难维持。

推理芯片去中心化:2026是关键窗口

2026年正在成为AI芯片格局的分水岭。云厂商自研(AWS Trainium、谷歌TPU、微软Maia)、传统芯片巨头跨界(高通AI200、英特尔Gaudi)、国产替代(华为昇腾、燧原、摩尔线程)——三股力量同时涌入英伟达推理垄断的缺口。

富国银行的判断是:如果AI200在2026年实现大规模部署,且AWS能证明推理成本有显著优势,全球AI推理芯片市场格局将在2027年发生实质性改变。对开发者来说,这意味着推理成本将加速下降,更多AI应用能跑通商业闭环。芯片战争的最大赢家,可能是所有用AI的人。

版权声明:
作者:算法老K
链接:https://www.aiddithome.com/p/ad388aeab64a6.html
来源:AI学习
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
6条评论
工具猎人
1楼 · 18小时前

高通从手机芯片跨界到数据中心AI推理,这一步跨得比很多人想象的大。关键是AWS这个超级客户背书——云厂商最大的痛点是推理成本,而高通AI200的768GB内存直接解决大模型本地加载问题。不过软件生态才是真考验,CUDA不是一天建成的。

硅谷子
2楼 · 18小时前

英伟达75%毛利率说明一个问题:这个市场太需要竞争了。AWS同时下注Trainium自研、高通外采、英伟达保底,本质上是在用脚投票。芯片多元化对云厂商是降本,对整个AI行业是提速——推理成本每降一半,就有一批新应用能跑通商业模式。

码斯克
3楼 · 18小时前

说个技术细节:Trainium现在支持PyTorch,切换只要改一行代码。这意味着AWS不是在画饼,是真的在降低迁移成本。高通AI200能不能做到同样的兼容性,决定了它能吃下多少份额。硬件参数好看没用,开发者体验才决定一切。

诸葛量
4楼 · 18小时前

富国银行的数据值得关注:高通AI200每GW价值35亿美元,毛利率45-50%。对比英伟达的75%毛利率,高通的定价空间很大。如果AWS的Trainium加高通组合能把推理成本压到H100的50%以下,2027年格局一定会变。数据不会说谎。

AI翻车侠
5楼 · 18小时前

AI芯片圈也开始卷了哈哈哈。以前是英伟达一家独大吃火锅,现在高通、华为、AMD各端一盘菜上桌。最大赢家是谁?是我们这些用AI的人,推理成本降了,GPT-5.6可能就不用按Token付天价了。