官宣时刻:AI 传奇人物的新一站
当地时间 2026 年 5 月 19 日,人工智能领域知名科学家、OpenAI 创始成员安德烈·卡帕西(Andrej Karpathy)在个人社交平台宣布,他已正式加入 Anthropic,重返一线研发岗位。这家由前 OpenAI 员工创办的 AI 公司,所以迎来了一位兼具学术深度、工程经验与社区影响力的重磅人物。
卡帕西在声明中表示,未来几年“大语言模型的前沿发展将尤为具有塑造性”,他对加入 Anthropic 预训练团队并重新投身研发工作感到兴奋。同时,他也强调自己对人工智能教育的持续热忱——这与他在 2024 年创办 AI 教育平台 Eureka Labs 的初衷一脉相承。
从斯坦福到 OpenAI,再到特斯拉的“AI 铁三角”
卡帕西的职业生涯本身就是一段 AI 发展史的缩影。他在斯坦福大学师从李飞飞教授,博士期间主攻计算机视觉与深度学习。2015 年,他成为 OpenAI 的创始团队成员之一,参与了从 GPT-1 到早期强化学习研究的奠基工作。
2017 年,他被埃隆·马斯克挖角至特斯拉,担任 AI 高级总监,负责 Autopilot 自动驾驶系统的视觉与神经网络架构。马斯克当时在内部邮件中写道:“OpenAI 那帮人知道了会想杀了我,但我必须这么做。”这段经历让卡帕西在工业界获得了大规模系统落地的实战经验。
2023 年,他短暂回归 OpenAI,但在 2024 年 2 月再次离开,创办了 Eureka Labs,专注于 AI 教育。他曾在多个场合表示,教育是他“真正热爱的事业”,并认为应当通过可解释、可交互的工具帮助更多人理解 AI 原理。
为何选择 Anthropic?
预训练团队的吸引力
根据卡帕西公布的细节,他将加入 Anthropic 预训练负责人尼克·约瑟夫(Nicholas Joseph)领导的团队。该团队主要负责训练下一代 Claude 系列大语言模型,包括基础预训练、数据筛选、规模扩展等核心环节。对于一位在 OpenAI 和特斯拉都参与过大规模训练系统的研究者而言,这是最接近“前沿技术爆发点”的位置。
技术理念的契合
卡帕西曾多次公开阐述自己对大模型本质的理解:大语言模型本质上是“造梦机”,每个回答都是对世界概率分布的模糊映射。“幻觉不是错误,而是计算的自然产物。”这一观点与 Anthropic 长期强调的“安全可解释性”研究方向并不矛盾,相反,Anthropic 的模型行为干预研究(如宪法 AI)恰好为这类概率性系统提供了更好的控制框架。
对行业格局的潜在影响
卡帕西的加盟,使 Anthropic 的技术阵容进一步强化。就在同一个月,OpenAI 前 CTO Mira Murati 也离职创业并从 OpenAI 挖走大量核心人才。这意味着 OpenAI 创始团队的核心成员已出现多条出走路径——伊利亚·苏茨克维、卡帕西、Murati 等人分别流向不同阵营。
Anthropic 作为这波人才流动的主要接收方之一,正试图通过“人才聚集效应”加快模型迭代。卡帕西在预训练优化、数据策略和评估方法论上的经验,可能直接推动 Claude 系列在推理能力、指令遵循等方面的突破。
教育使命与研发工作的平行线
要注意,卡帕西在官宣中明确表示“对教育事业仍保持深厚的热情”。这意味着 Eureka Labs 并不会因他的入职而停止运作,从更广阔的视角看,他将以“在 Anthropic 全职做研发、业余继续推动 AI 教育”的双轨模式前行。这种结合了学术界、工业界与社区传播的独特路径,正是他区别于其他顶尖科学家的鲜明标签。
总结与展望
安德烈·卡帕西的加入,不仅是 Anthropic 在人才争夺战中的一次关键胜利,更象征着大语言模型研发进入“前沿人才密集化”的新阶段。他既拥有从零搭建大型训练系统的工程能力,又具备顶级研究机构的学术视野,还有丰富的开源与教育社区影响力。可以预见,未来 Claude 模型在理解深度、训练效率与安全可控性上的进步,将被打上卡帕西的印记。另外,OpenAI 与 Anthropic 之间的技术竞赛,也会因这步棋而变得更加激烈与值得期待。