xAI核心架构师庄钧堂离职:预训练技术路线将如何调整?
5月10日,xAI核心研发团队再现关键人事变动。主导Grok系列模型预训练工作的研究负责人庄钧堂确认离职。公开信息显示,其实际离职发生在两个月前,近日才对外披露。
庄钧堂的履历在AI研究领域颇具分量。他于2024年加入xAI,任职期间全面负责Grok多代模型的预训练工作,并主导了Grok在X平台与特斯拉平台的语音模型开发,以及面向企业级客户的API模型架构。此前,他是OpenAI的核心技术成员,深度参与了GPT-4技术报告的撰写,是GPT-4o多模态模型与DALL·E 3图像生成系统的关键开发者之一。GPT-4 Turbo的128K上下文窗口算法优化,以及OpenAI整个Embedding模型技术体系的搭建,均有他的主导贡献。
他的离职时间点,正值xAI组织架构发生剧烈震荡之际。就在几天前,埃隆·马斯克宣布xAI将结束独立运营,整体并入SpaceX,以“SpaceXAI”的名义进行重组。这一战略调整立即引发了连锁反应,多名核心员工在消息公布当天选择离开。
xAI的人才流失问题已持续发酵。自2024年中旬起,公司联合创始人及多位核心研究员便开始陆续出走。截至今年3月底,初创时期的11位联创成员已全部离场。据行业媒体统计,过去一年内,xAI确认离职的员工总数已超过80人。对于一家处于关键发展阶段的AI初创公司而言,这一规模的人才外流无疑构成了严峻挑战。
为应对组织危机,马斯克正寻求外部解决方案。今年4月,xAI与AI编程工具公司Cursor启动合作,部分Cursor工程师已进驻xAI办公室参与联合研发项目。目前,相关协作会议由xAI研究负责人Aman Madaan主持推进。
然而,外部引援的尝试同样遭遇波折。此前,马斯克从Mistral AI及Thinking Machines Lab挖来了联创成员Devendra Chaplot,并安排其直接向自己汇报。但Chaplot入职仅一个月便迅速离职。事后,马斯克公开承认xAI“未建立在正确的基础之上”,公司正处于“从头重建”的阶段。
尽管组织层面动荡不安,xAI的产品线推进似乎未受根本性影响。最新版本的Grok模型已集成连接器功能,能够接入电子邮件、日历及Notion等生产力工具,执行邮件信息提取与智能日程整理等任务。
针对外界关于“Grok项目可能被边缘化”的猜测,马斯克近期也作出了公开澄清。他明确表示,新一代Grok模型仍在xAI的Colossus 2计算集群上持续训练。此前,由于xAI将部分Colossus集群资源租借给竞争对手Anthropic,曾引发市场对其是否削减自身模型训练投入的质疑。
