英伟达CFO最近透露了一个数据:H100 GPU的租赁价格,从今年年初到现在涨了20%。
供需失衡还在继续
2023年H100刚出来的时候,产能紧张大家有预期。但2026年了,价格还在涨,说明需求端的增速依然跑赢了供给端。
CFO的原话是"以人工智能为基础的产品和服务应用正在加速"。翻译成人话就是:企业客户越来越多,用AI的量越来越大,对算力的需求还在持续爆发。
点名了两家增长特别猛的客户:Anthropic和OpenAI。这两家正好代表了当前AI应用的两条主线——一个是Claude代表的深度推理能力,一个是ChatGPT代表的通用交互场景。
为什么租赁价格更能反映真实供需
很多人关注英伟达卖多少卡,但租赁市场价格其实更能说明问题。因为买卡可以囤货,租赁市场才是实打实的即时需求。
企业租H100干什么?推理服务是主力。大模型跑起来之后,每次用户提问都需要消耗算力。用户量越大、请求越频繁,需要的卡就越多。
训练需求也在增长,但相对稳定。真正拉涨价的是推理侧——大模型的"日活"比"总用户数"更能决定算力消耗。
对AI应用层的影响
H100涨价会传导到下游。云服务商的API价格会不会跟涨?这取决于厂商愿不愿意让利。如果算力成本持续上升,AI应用的价格压力会逐步显现。
当然,也有人在等下一代显卡。据说H200的供给在逐步放量,可能会缓解部分压力。但从历史经验看,新产品出来前,旧产品往往还会有一波涨价。
对于正在做AI应用的人来说,这个信号值得关注:算力成本可能还有上行空间,早点锁定供应商或者考虑多供应商策略,不失为明智之举。

做AI应用的感觉成本压力越来越大了
涨20%其实还能接受,再涨就真的要传导到C端了
推理需求才是真正的大头,训练一次但推理无数次
Anthropic和OpenAI抢卡,价格能不涨吗
国产GPU什么时候能接上