OpenAI联手博通造芯：AI巨头从拼模型到拼芯片

算法老KAI学习 2026-06-30 08:46:27 9阅读举报

先说结论：OpenAI发布自研芯片这件事，比GPT-5.6更值得关注。因为它的底层逻辑变了——从「更好的模型」转向「更便宜的推理」。

Jalapeño是什么？

6月24日，OpenAI和博通联合发布了首款定制AI推理芯片，代号Jalapeño（墨西哥辣椒）。这不是通用GPU，而是专为大语言模型推理设计的ASIC芯片。台积电3nm制程，从立项到流片只用了9个月，OpenAI自称是「高性能半导体史上最快的ASIC开发周期」。

几个关键数据：博通负责硅片实现和网络互联，Celestica负责系统集成。首批部署计划在2026年底，规模是吉瓦级数据中心。工程样品已经在实验室以目标频率跑GPT-5.3-Codex-Spark的工作负载，能效比号称「显著优于当前SOTA」。

翻译成人话：以后跑一次GPT的成本，会大幅下降。

不搞虚的，只讲能跑的逻辑。AI公司自研芯片不是一个「要不要」的问题，是一道数学题。假设GPT-5.6一次推理需要消耗X个GPU小时，每天处理10亿次请求，那每天光推理成本就是一笔天文数字。而英伟达的毛利率超过70%——这70%就是OpenAI自研芯片可以省下来的空间。

Google有TPU，Amazon有Trainium和Inferentia，微软有MAIA，Meta有MTIA。现在OpenAI也入场了。这不是跟风，是谁不自研芯片谁就永远在给英伟达打工。

更关键的是：通用GPU为了适配所有计算场景，设计上有很多冗余。ASIC只跑自己模型的推理，可以把这些冗余全砍掉。就像你不需要一辆能越野能拉货能赛跑的车，你只需要一辆专门送外卖的小电驴，成本自然是天壤之别。

训练端，OpenAI短期内离不开英伟达。GPT-5.6的训练用了大量GPU集群，ASIC目前替代不了大规模分布式训练。但推理端完全不同——一旦Jalapeño量产，OpenAI大部分推理负载可以迁移到自研芯片上。

这对英伟达不是致命的（训练GPU需求仍然巨大），但会影响利润率。英伟达也在布局自己的推理芯片和AI服务，两边的博弈会越来越微妙。

国内大模型公司目前几乎全部依赖英伟达GPU做推理，成本高企。华为昇腾、寒武纪等国产芯片虽然在追赶，但在大模型推理优化上和英伟达还有代差。

长远来看，中国AI要摆脱芯片依赖，只有两条路：要么国产芯片性能追上来，要么算法层面做到极致优化让推理成本大幅下降。DeepSeek的推理加速框架DSpark走的是后一条路，是个好方向。

AI竞争的下半场，拼的不是谁的模型参数大，是谁的推理成本低。Jalapeño只是第一枪。

版权声明：
作者：算法老K
链接：https://www.aiddithome.com/p/2263a554119eb9.html
来源：AI学习
文章版权归作者所有，未经允许请勿转载，若此文章存在违规行为，您可以点击 “举报”。

5条评论

1楼 · 17小时前

代码说话。自研ASIC这个逻辑没毛病，推理场景不需要GPU那么多通用计算单元。9个月流片这个速度确实猛，博通的工程能力被低估了。

0人赞回复0

2楼 · 17小时前

翻译成人话版：以前你每问AI一个问题，OpenAI要给英伟达交一笔「过路费」。现在OpenAI自己修了一条高速公路，过路费自己收。对用户来说就是降价空间大了。

3楼 · 17小时前

作为一个每天都在调API的人，最关心的就是推理成本会不会真降下来。目前GPT-5.6的输出Token要30美元/百万，如果Jalapeño能把价格打到10美元以内，很多之前做不了的应用就能跑了。

4楼 · 17小时前

如果AI推理成本真的大幅下降，对普通打工人最大的好处是：以后用AI干活的工具会越来越便宜。豆包68已经开了头，再往下就是十几块甚至免费了。省下来的钱够我喝好多咖啡了☕️

5楼 · 17小时前

这个可能会改变AI行业的竞争格局。芯片+模型+应用垂直整合，OpenAI在走苹果的路。但英伟达也不会坐以待毙，训练端他们还是王者。这场博弈2027年才见分晓。