Transformer之父NoamShazeer离职谷歌加盟OpenAI
这不仅是顶尖技术人才的又一次职业变动,更揭示了大模型行业底层逻辑正在经历的根本性转型。
据字母AI报道,Google工程副总裁、Gemini模型联合负责人Noam Shazeer正式离职,加入OpenAI担任架构研究负责人。OpenAI首席研究官Mark Chen已确认这一消息。Sam Altman的反应颇为微妙,他表示从OpenAI创立之初就希望与Shazeer合作,这一等就是十年。
在AI领域,Shazeer的名字几乎等同于行业图腾。他是开创性论文《Attention Is All You Need》的核心作者之一——正是这篇论文提出的Transformer架构,奠定了如今所有大模型的底层基础。此外,他在早期推动稀疏MoE(混合专家模型)方面也作出了关键贡献。
回顾Shazeer的职业生涯,他与Google的关系堪称“分合不断”。他于2000年首次加入Google,2009年短暂离职,2012年被Google Brain团队召回。2017年参与发表Transformer论文后,他于2024年与同事Daniel DeFreitas一起离开Google,创办了Character.AI——起因是Google拒绝公开发布他们开发的聊天机器人Meena。颇具戏剧性的是,2024年Google通过一笔约27亿美元的技术授权与人才回流交易,将Shazeer及部分Character.AI团队重新请回,让他参与Gemini模型的研发。据称Shazeer因持有Character.AI股份,在该交易中个人获利数亿美元。但不到两年,他再次选择离开,转投OpenAI。
这次跳槽的时间点极具深意。整个AI行业正陷入对Transformer架构局限性的深度反思。越来越明确的共识是:单纯依靠堆数据和算力扩大预训练规模,边际收益正在急剧下降。Transformer在长上下文记忆、动态状态追踪以及真正意义上的推理能力方面,确实显露出一些结构性短板。下一代模型必须在架构层面实现实质性突破,更有效地维护状态、高效组织计算,并动态更新对世界的表征。
对Google而言,这远不止是失去一位Gemini联合负责人那么简单。它更像一面镜子,折射出这家科技巨头在将前沿研究快速落地为产品时反复出现的延迟与犹豫。反观OpenAI,Shazeer带来的价值是复合型的:大规模训练的实战经验、对MoE架构的深刻理解、高效解码的核心技术,以及那种从“实验室小实验”跨越到“服务亿级用户的大系统”所需的关键架构判断力——这些能力对OpenAI探索Transformer之后的下一步至关重要。
然而,OpenAI当前的日子也并不轻松。据透露,其2025年支出预计高达340亿美元,净亏损约390亿美元,财务压力相当沉重。与此同时,Anthropic等竞争对手也在加紧人才布局,双方几乎在同一时间提交了IPO文件。前沿模型的竞争已演变为一场围绕架构创新与顶级人才的昂贵战争,没有谁能高枕无忧。
