深度解析Karpathy加入Anthropic：为何选择成为Dario的“-2”？

2026-05-20阅读 0热度 0

Anthropic

新智元报道

5月19日，AI界发生了一件足以影响格局走向的大事：OpenAI联合创始人、“Vibe Coding”概念的提出者安德烈·卡帕西（Andrej Karpathy）宣布加入Anthropic的预训练团队。

他的任务很明确：组建一个新团队，用Claude自身来加速预训练研究。消息一出，立刻引发了行业内的广泛讨论。一个师从辛顿和李飞飞、与奥特曼共事、曾是马斯克直接下属的顶尖人物，为何会选择加入竞争对手，并且甘愿在组织架构中处于一个并非顶层的职位？Anthropic又为何对他势在必得？

一个定义行业的人

要理解这次人事变动的分量，首先得理解卡帕西这个人。他的稀缺性，远不止于技术能力——这个级别的研究者虽然不多，但总有一批。他真正的独特之处，在于其定义范式的能力。他总能用一两个词，就改变整个行业理解某个问题的方式。

从多伦多大学时期参加杰弗里·辛顿的读书会，到斯坦福师从李飞飞并一手打造了全球计算机视觉入门“第一神课”CS231n，卡帕西的起点就站在了浪潮之巅。2015年，他成为OpenAI的创始研究科学家；2017年，被马斯克挖至特斯拉担任AI总监，推动自动驾驶走向纯视觉方案。

同年，他在一篇广为流传的文章中提出了“Software 2.0”的概念，将神经网络权重比作新代码，数据集比作源代码，梯度下降比作编译器。这个框架，重塑了人们对编程的认知。

离开特斯拉后，他在YouTube上开设的“Neural Networks: Zero to Hero”系列课程，以及开源项目micrograd、nanoGPT等，都因其极简而精准的风格，被奉为“可运行的教科书”。2025年，他创造的“Vibe Coding”一词甚至被柯林斯词典选为年度词汇。随后提出的“Software 3.0”和“Agent的十年”框架，更是成为当年最受关注的AI叙事之一。

可以说，卡帕西留下的最持久的遗产，并非某个具体产品或论文，而是这些改变了行业思维模式的概念框架。

为何甘居“-2”？

此次加入Anthropic，卡帕西在组织架构中的位置颇值得玩味。他将进入由尼克·约瑟夫领导的预训练团队，而约瑟夫则向Anthropic联合创始人兼CEO达里奥·阿莫代汇报。这意味着，卡帕西在层级上处于第三位。

对于一个即将40岁、早已功成名就且财务自由的人来说，这似乎不是一个“最优”选择。但回顾卡帕西的职业生涯，一条清晰的线索浮现出来：他追逐的从来不是头衔，而是“当下最大、最前沿的实验场”。

2017年去特斯拉，是因为自动驾驶是实践“Software 2.0”理念的最大试验田。2024年离开，是因为架构已定，剩下的主要是工程优化。同年回归OpenAI，是因为ChatGPT与GPT-4带来的爆发期正是最刺激的前沿。2024年创办Eureka Labs，是想验证AI原生教育的假设。而如今加入Anthropic，则是因为他看到了“用AI研究AI”的预训练革命正在这里发生。

每一次离开，都不是出于对前一份工作的不满，而是因为那个“最大的实验”已经转移了阵地。

那么，为什么不是回到OpenAI呢？人才流向本身给出了答案。过去两年，从OpenAI流向Anthropic的核心人物名单令人瞩目：前对齐负责人扬·莱克、联合创始人约翰·舒尔曼，现在则是卡帕西。这种单向流动的趋势，没有任何可比的反向案例。

这背后反映的是两家公司战略重心的分野。OpenAI正日益转向平台化和大规模收购，快速向“AI时代的消费巨头”演进。而对于一个在官宣中明确表示要“回归研发”的研究者来说，Anthropic坚持的“以研究质量取胜”的路线，显然更具吸引力。

Anthropic的“算盘”

Anthropic对卡帕西的渴求，动机是多层次的。

最表层是直接的技术需求。在算力军备竞赛中，背靠微软的OpenAI和坐拥TPU的谷歌拥有天然优势。Anthropic若想胜出，必须找到一条用更少算力训练出更强模型的路径。“用Claude加速预训练研究”正是这条路线，而卡帕西恰好是少数能在大规模训练实践与前沿理论之间架起桥梁的人。

往下一层，是人才吸引人才的“飞轮效应”。连续吸纳OpenAI的核心人物，强化了“一线研究者用脚投票”的叙事，这能显著降低后续吸引其他顶尖人才的心理门槛。

再者，是IPO前的品牌镀金。目前，Anthropic正以约9000亿美元的估值进行巨额融资，并为IPO做准备。卡帕西作为AI领域公众辨识度最高的技术布道者之一——拥有百万订阅的YouTube频道、创造年度词汇、其CLAUDE.md仓库在GitHub上收获超过22万星标——他的加盟，无疑为公司的技术声誉和故事增添了极具分量的一笔。

然而，最具长期价值的一层，或许是卡帕西那无与伦比的“定义范式”的能力。他在Anthropic所做的任何探索，都极有可能通过他的推文、博客或视频被公开谈论和阐释。当他用自己独特的方式为某项技术或趋势命名时，Anthropic便自然而然地成为那个范式的“原产地”。这相当于招聘一位顶级研究者的同时，附带获得了行业里最具影响力的技术叙事者。

飞轮的临界点

将这次人事变动置于更大的技术背景下观察，它可能标志着一个关键的拐点。

2026年4月，Anthropic发布了迄今为止最强大的模型Mythos。其能力之强，甚至超出了开发者的预期。例如，它在未被专门训练网络安全的情况下，自主发现了FreeBSD中一个存在17年的远程代码执行漏洞，以及OpenBSD、FFmpeg中的其他古老缺陷。英国AI安全研究所的评估确认，它是首个能完整执行32步复杂网络攻击模拟的模型。

Anthropic承认，这些能力并非刻意训练所得，而是通用推理与软件工程能力提升后“自然涌现”的结果。这揭示了一个核心逻辑：预训练做得越好，涌现出的能力就越超出预期。

现在，卡帕西要做的，正是拿起Mythos/Claude这把“最强的锤子”，去改进“制造锤子”的工艺本身。即利用AI来发现更优的训练架构、数据配比和实验方向，让模型改进的速度脱离人类研究者的线性节奏，启动“AI改进AI”的进化飞轮。

一旦这个飞轮真正高速运转起来，“AI自我改进预训练”就将从一个研究课题，转变为通往更高级智能的加速通道。届时，当前围绕算力、数据和人才的竞争维度，都可能被彻底改写。

三年内，OpenAI连续失去三位核心人物给同一个竞争对手，这个事实的影响或许比任何融资数字都更为深远。算力可以购买，数据可以积累，但能够亲手启动并推动那个关键进化飞轮的人，全世界屈指可数。卡帕西选择在此时放下自由身份回归一线，显然是他判断，那个决定性的窗口，已经就在眼前。

深度解析Karpathy加入Anthropic：为何选择成为Dario的“-2”？

一个定义行业的人

为何甘居“-2”？

Anthropic的“算盘”

飞轮的临界点

相关阅读

最新教程

最新资讯