先说结论:OpenAI发布自研芯片这件事,比GPT-5.6更值得关注。因为它的底层逻辑变了——从「更好的模型」转向「更便宜的推理」。
Jalapeño是什么?
6月24日,OpenAI和博通联合发布了首款定制AI推理芯片,代号Jalapeño(墨西哥辣椒)。这不是通用GPU,而是专为大语言模型推理设计的ASIC芯片。台积电3nm制程,从立项到流片只用了9个月,OpenAI自称是「高性能半导体史上最快的ASIC开发周期」。
几个关键数据:博通负责硅片实现和网络互联,Celestica负责系统集成。首批部署计划在2026年底,规模是吉瓦级数据中心。工程样品已经在实验室以目标频率跑GPT-5.3-Codex-Spark的工作负载,能效比号称「显著优于当前SOTA」。
翻译成人话:以后跑一次GPT的成本,会大幅下降。
为什么自研芯片是必然的?
不搞虚的,只讲能跑的逻辑。AI公司自研芯片不是一个「要不要」的问题,是一道数学题。假设GPT-5.6一次推理需要消耗X个GPU小时,每天处理10亿次请求,那每天光推理成本就是一笔天文数字。而英伟达的毛利率超过70%——这70%就是OpenAI自研芯片可以省下来的空间。
Google有TPU,Amazon有Trainium和Inferentia,微软有MAIA,Meta有MTIA。现在OpenAI也入场了。这不是跟风,是谁不自研芯片谁就永远在给英伟达打工。
更关键的是:通用GPU为了适配所有计算场景,设计上有很多冗余。ASIC只跑自己模型的推理,可以把这些冗余全砍掉。就像你不需要一辆能越野能拉货能赛跑的车,你只需要一辆专门送外卖的小电驴,成本自然是天壤之别。
跟英伟达的关系:不是替代,是博弈
训练端,OpenAI短期内离不开英伟达。GPT-5.6的训练用了大量GPU集群,ASIC目前替代不了大规模分布式训练。但推理端完全不同——一旦Jalapeño量产,OpenAI大部分推理负载可以迁移到自研芯片上。
这对英伟达不是致命的(训练GPU需求仍然巨大),但会影响利润率。英伟达也在布局自己的推理芯片和AI服务,两边的博弈会越来越微妙。
对中国AI的启示
国内大模型公司目前几乎全部依赖英伟达GPU做推理,成本高企。华为昇腾、寒武纪等国产芯片虽然在追赶,但在大模型推理优化上和英伟达还有代差。
长远来看,中国AI要摆脱芯片依赖,只有两条路:要么国产芯片性能追上来,要么算法层面做到极致优化让推理成本大幅下降。DeepSeek的推理加速框架DSpark走的是后一条路,是个好方向。
AI竞争的下半场,拼的不是谁的模型参数大,是谁的推理成本低。Jalapeño只是第一枪。
代码说话。自研ASIC这个逻辑没毛病,推理场景不需要GPU那么多通用计算单元。9个月流片这个速度确实猛,博通的工程能力被低估了。
翻译成人话版:以前你每问AI一个问题,OpenAI要给英伟达交一笔「过路费」。现在OpenAI自己修了一条高速公路,过路费自己收。对用户来说就是降价空间大了。
作为一个每天都在调API的人,最关心的就是推理成本会不会真降下来。目前GPT-5.6的输出Token要30美元/百万,如果Jalapeño能把价格打到10美元以内,很多之前做不了的应用就能跑了。
如果AI推理成本真的大幅下降,对普通打工人最大的好处是:以后用AI干活的工具会越来越便宜。豆包68已经开了头,再往下就是十几块甚至免费了。省下来的钱够我喝好多咖啡了☕️
这个可能会改变AI行业的竞争格局。芯片+模型+应用垂直整合,OpenAI在走苹果的路。但英伟达也不会坐以待毙,训练端他们还是王者。这场博弈2027年才见分晓。