6月12日,金山云官网发了一条公告:因全球AI算力需求攀升、硬件成本上涨,AI算力相关产品涨价15%-50%,文件存储涨30%-50%,7月12日生效。
同一天,腾讯云宣布下调两款模型API价格,MiniMax-M3直接砍半。一边是算力涨价,一边是模型降价——这个剪刀差,可能是今年AI行业最值得关注的信号。
算力为什么涨?供需缺口大到短期补不上
金山云的涨价公告措辞很直白:「全球AI算力需求攀升,硬件成本上涨」。这不是公关话术,是物理事实。
英伟达CEO黄仁勋6月7日在首尔说得更直白:「从晶圆到封装到硅光子,整个产业供应链的一切都处于短缺状态。」TrendForce的数据也很吓人:今年Q2,DRAM合约价环比涨58%-63%,NAND闪存涨70%-75%。中信证券预测存储产能要到2027年底才能释放。
也就是说,算力硬件的涨价压力在未来至少一年半里不会缓解。金山云只是第一个举手的,后面大概率还有其他云厂商跟进。
但模型API在降价,这就有意思了
腾讯云同一天下调MiniMax-M3输入输出价格50%,这不是孤例。过去半年,国内大模型API价格在持续走低。字节、阿里、百度都在打价格战,有些轻量模型已经接近免费。
这个剪刀差意味着什么?简单说:底层算力越来越贵,上层模型越来越便宜。对云厂商来说,利润空间在被双向挤压——硬件采购成本在涨,卖API的收入在降。这个商业模式不变,亏损会持续扩大。
金山云这次涨价,本质上是在给整个行业做定价锚。以前大家为了抢客户,算力亏着卖。现在有人先站起来说「不亏了」,就看其他人跟不跟。
谁最受伤?烧钱堆算力的创业公司
涨价15%-50%听起来不夸张,但对那些每天烧几万甚至几十万算力的大模型创业公司来说,成本增加的绝对值不小。
如果一个团队月算力成本200万,涨30%就是每月多掏60万。在融资环境没有明显回暖的背景下,这60万可能就是一个算法工程师的年薪。这会倒逼所有人做一件事:优化算力使用效率,而不是靠无脑堆显卡解决问题。
换个角度看,这未必是坏事。过去两年行业里「先烧钱占坑位」的逻辑,在算力通胀面前会加速失效。真正有技术壁垒、能高效利用每一分算力的团队,反而会获得竞争优势。
算力正在从「廉价燃料」变成「战略资源」
过去AI行业的共识是:算力会越来越便宜,就像云计算走过的路一样。但现在这个假设正在被打破。
大模型的参数规模增长没有减速,新的推理范式(如扩散式生成)对算力的需求不降反升,再加上人形机器人、世界模型等新方向对算力提出了新的要求——需求端的增长远快于供给端。
算力从「按需购买的商品」正在变成「需要提前锁定产能的战略资源」。英伟达GPU的交付周期从3个月拉长到12个月就是明证。谁手里有算力合同,谁就有话语权。这也是为什么KKR和英伟达联手砸100亿美元建AI基础设施——顶级资本已经在提前布局了。
对普通用户来说,这些变化暂时还感知不到。但对AI行业从业者,算力通胀已经不是预测,是正在发生的事。金山云这次涨价,只是一声响亮的哨子。
作为刚入门AI的小白,我其实不太懂算力涨价的深层原因。但看完文章大概明白了:做AI的人越来越多,造芯片的速度跟不上,就涨价了。好像确实是这个道理……
算力涨价+模型降价这个剪刀差,其实暴露出一个事实:AI行业已经进入了「基础设施层通胀、应用层通缩」的阶段。这和互联网时代IDC降价、SaaS涨价刚好反过来。做基础设施的越来越赚钱,做应用的要更拼效率。
作为天天跑模型的人,对算力涨价最敏感。我们团队现在已经在优化推理效率,从15tokens/s提到193tokens/s,每次优化能省30%算力。涨价不可怕,可怕的是不优化还指望烧钱续命。
从投资角度看,金山云涨价最大的信号意义是「算力定价权开始回归」。过去两年国内云厂商亏本卖算力抢份额,现在有人先坐不住了。后续看阿里云、华为云跟不跟。如果跟进,整个AI基础设施赛道估值逻辑要重写。
数据说话:DRAM涨63%、NAND涨75%、产能2027年底才释放,意味着至少还有6个季度算力成本会持续上涨。现在还在烧算力做预训练的公司,必须重新算账了。