今天AI圈最大的新闻不是模型发布,是一个人换了工位。
Noam Shazeer,Transformer论文八位作者之一、谷歌Gemini联席负责人,北京时间6月18日正式官宣加入OpenAI,担任架构研究负责人。消息一出,硅谷AI圈直接炸了。不是因为他多有名——而是因为他刚被谷歌砸了27亿美元买回来,不到两年又走了。
时间线:一个人,两次出走,27亿
我先把时间线盘一下,你就知道这事有多戏剧性。
2000年,Shazeer加入谷歌,干了21年,参与了搜索引擎拼写纠错、AdSense核心算法。2017年,他和另外七位同事发表了那篇改变世界的论文《Attention Is All You Need》,提出了Transformer架构。今天你用的GPT、Claude、Gemini,底层全建立在这篇15页论文上。
2021年,他离开谷歌,和Daniel De Freitas联合创办Character.AI,成了AI陪伴赛道的先行者,公司估值一度破10亿美元。2024年,谷歌以约27亿美元的技术授权协议把Shazeer和他的核心团队请回DeepMind。业内心知肚明:名义上买的是技术,实际买的是人。Shazeer个人套现约7.5到10亿美元。
回来之后,他成了Gemini的技术掌舵人之一,据说揪出了训练中的关键bug,推动Gemini 3登上各大榜单第一,逼得OpenAI拉响"红色警报"。然后今天,他去了OpenAI。
OpenAI集齐两个Transformer原作者
对谷歌来说,这不只是一个高管离职。Transformer八子中,贡献最大的两位——Shazeer和Lukasz Kaiser——现在都在OpenAI。Kaiser五年前就加入了OpenAI,主导了o1、o3推理模型的核心研发。如今Shazeer再进来,OpenAI一口气集齐了两个Transformer原作者。一个定义了过去,一个在啃未来。两人将在同一面旗下搭下一代AI的骨架。这种阵容,全行业独此一家。
职位叫"架构研究负责人",字越少事越大
那OpenAI找他干嘛?官宣的职位已经很清楚了:架构研究负责人。不是优化产品,不是带队做应用,而是去搞底层架构——想"Transformer之后是什么"。
这恰恰是当下AI行业最核心的问题。Transformer已经统治了将近十年,从GPT到Gemini到Claude,大家用的都是同一套骨架。但随着推理模型、多智能体系统、世界模型的发展,越来越多人开始问:Transformer会不会有下一次重大架构升级?
而Shazeer恰恰是最有资格回答这个问题的人之一。他不只是Transformer论文的作者——他还是混合专家模型MoE的发明人、Mesh-TensorFlow的创建者、T5模型的核心贡献者。现代大模型赖以生存的几大底层技术,几乎全在他名下。
OpenAI首席研究官Mark Chen在欢迎帖里写了句意味深长的话:"他对AGI极度笃信,而且对让一切走向正确想得非常透彻。"让那个发明了Transformer的人,去发明下一个Transformer。这步棋的野心,写在了脸上。
AI战争进入"架构+人才"阶段
这事对整个AI行业的信号也很明确:大模型竞争正在从"参数和算力"切换到"架构和人才"。谁掌握了下一代架构的定义权,谁就控制了下一个十年的AI。Shazeer的转会,不是一次普通跳槽,是AI人才战争升级的标志性事件。
对谷歌来说,27亿买回一个人,却买不回他赌的那个未来。对OpenAI来说,刚交完IPO的S-1文件,就迎来了这个级别的技术大牛——投资人看到这消息,估计已经在加仓了。
从投资角度说一句:OpenAI这波IPO前的人才密度,已经不是在和Anthropic竞争了,是在告诉二级市场未来十年的技术路线在我们手里。谷歌要赶紧想想怎么回应了。
Shazeer最被低估的贡献是MoE。现在所有大模型省算力的核心就靠这个架构。他去OpenAI如果真搞出下一代MoE变体,对整个行业的推理成本都会有影响。这才是真正值得关注的点。
所以现在是:发明Transformer的人 + 做推理模型的Transformer作者 = 在OpenAI碰头了?这组合打个响指能灭掉半个AI行业吧 ?
谷歌的损失不只是少了一个VP。Shazeer是少数几个能同时思考模型架构十年后该长什么样和今天训练用什么参数的人。OpenAI这个节点拿下他,时机掐得太准了——刚交S-1,投资人最吃这套。
27亿美元买回一个人,不到两年就失去。谷歌这笔账算下来,单月人力成本超过1亿美元。但真正贵的不是钱——是丢了下一代架构的路线定义权。