Claude AI 破解80年数学难题:权威榜单与深度测评解析
OpenAI宣布GPT-5.5模型破解一道尘封80年的数学难题后,AI领域的竞争迅速升温。5月26日,Anthropic工程师Sholto Douglas在X平台证实,其Claude Mythos模型同样独立完成了对该难题的求解。
这道难题即著名的“平面单位距离猜想”,由保罗·埃尔德什(Paul Erdős)于1946年提出。OpenAI团队在5月21日刚刚公布了基于GPT-5.5的突破性进展。
Douglas在推文中指出,Claude Mythos生成的证明过程“构思精巧且逻辑简洁”。他认为,这一成果清晰地揭示了AI在数学推理与定理证明领域仍具备广阔的探索空间和未被充分释放的潜能。
此次测试采用的协作方法值得关注。Douglas设计了一个多实例协同工作流:多个具备Mythos访问权限的Claude Code实例首先并行接收问题,各自推导可能的证明方向。随后,一个主导实例负责整合所有初步思路,再将优化后的方案分发回各个实例进行深度迭代。这种“并行探索-集中合成”的递归框架,为AI处理高复杂度逻辑问题提供了新的协同求解思路。
成果不免被置于专业审视之下。数学家Daniel Litt在评估后指出,Mythos的证明在严谨性或完备性上“略逊于”OpenAI的版本。这或许涉及证明结构的优雅度、逻辑链的严密性等深层学术标准。然而,两大前沿AI模型在短期内相继攻克同一历史性猜想,无疑标志着自动推理技术迈入了新的发展阶段。
