Claude Mythos 攻克 Erdős 猜想:简明证明深度解析与算法突破榜单
5月26日,Anthropic的工程师Sholto Douglas在社交平台上公布了一则重磅消息:他们最新的模型Claude Mythos,通过一个“巧妙而简洁的证明”,成功解决了几何组合领域那个悬而未决的百年难题——埃尔德什单位距离猜想。要知道,就在几天前,OpenAI刚刚宣布其GPT-5.5模型攻克了同一座数学高峰。两大巨头在纯数学发现这个“硬核”赛道上接连亮见,竞争的激烈程度可见一斑。
这次突破的看点,远不止于结果本身,更在于其背后独特的实现路径。Anthropic团队并没有依赖单一模型单打独斗,而是构建了一套多智能体协同作战的自动化系统。在这个系统里,一个拥有Mythos访问权限的智能体负责“出主意”,生成多种可能的解题思路;随后,另一个智能体会汇总这些思路,并分发给其他独立运行的Claude Code实例进行“交叉验证”。这种模式,俨然是让一群AI专家组成一个高效的“学术委员会”,共同审议和推进解决方案。
有趣的是,尽管有数学家评价Mythos的初始成果在绝对表现上“略逊于”OpenAI的解法,但它最终还是独立找到了与对手相同的核心路径,并且推导出了一个更具独创性的精简证明。目前,由Opus4.7整理完成的完整证明版本已经正式发布。这不禁让人思考,在通往真理的道路上,不同的AI方法论或许最终会殊途同归。
这一系列事件,无疑给业界那个老生常谈的争论又添了一把火:纯大语言模型(LLM)和符号推理辅助系统,究竟哪条路才是AI解决复杂科学问题的未来?
此前,谷歌DeepMind的AlphaProof Nexus系统曾一举解决了9个埃尔德什问题,但其高度依赖Lean形式化证明语言,这让一些研究者对其“自主推理”的成色有所保留。相比之下,Claude Code所代表的多智能体协同框架,似乎提供了一种不同的解题哲学——它不追求单个模型的“全能”,而是通过分工与协作来攻克人类顶级的科学堡垒。
话说回来,当前的AI领域正处在一个范式剧烈变革的关口。有菲尔兹奖得主证实,ChatGPT5.5Pro已经能在两小时内自主完成博士级别的数学研究。如今,随着Claude Mythos与GPT-5.5在算法发现乃至系统漏洞利用等前沿领域不断展现出自主演进的能力,一个清晰的趋势正在浮现:AI正在彻底告别早期的“提示词工程”阶段,大步迈入一个具备深度逻辑推理与主动科学探索能力的自主智能体时代。这不仅仅是技术的迭代,更可能是一场研究范式的根本性革命。
