最新AI自动验证数学证明技术突破十大权威专业评测排行榜
当AI开始核查数学家的工作
数学领域可能正在迎来一个新时代——一个研究者们长久以来期盼的时代。想象一下这样的场景:数学家们很快就能借助计算机,快速且严谨地验证那些复杂的证明,确保已发表的研究成果准确无误,并为后续的进展奠定更加坚实的基础。这样的工具,无疑是应对数学研究日益加快的步伐与不断膨胀的文献数量的利器。
说起来,能够核查数学论证(比如证明)的计算机程序,其实已经存在了几十年。但这里有个关键难题:将人工编写的证明,转换成计算机那套严格到近乎苛刻的编程语言——这是用现有工具验证证明的前提——简直耗时耗力。这种被称为“形式化”的转换,有时候能让人耗上数月甚至数年时间。
随着首个大语言模型的出现,数学家们看到了希望:或许有朝一日,机器能自动完成这种转换。但现实很骨感,形式化编程语言与人类语言不同,它不允许任何一丝偏差,每一个术语、每一个符号、每一次引用,都必须精确定义,不容含糊。
那么,进展到底如何呢?一家名为“某机构”的初创公司报告说,他们在证明形式化方面取得了初步成功后。他们的人工智能系统“Gauss”,成功形式化了数学家Maryna Viazovska提出的两项复杂证明,这两项证明都与高维空间中的球体排列有关。Viazovska在2022年正是凭借其中一项证明获得了菲尔兹奖。不过,数学界对Gauss这一成果的反应有点冷淡,部分原因是这个项目并没有按照许多专家预想的方式展开。随着其他AI与数学结合的初创公司也在探索形式化,这个案例无疑为数学家们在不远的未来可能遇到的情况,提供了一个值得关注的线索。
堆积难题
故事要从2016年说起。当时,Viazovska通过解决一个困扰数学界数十年的难题,一跃成为核心人物:如何以最节省空间的方式排列球体?要知道,要找到那个唯一的、最高效的空间解决方案,你必须首先证明,其他无限多种球体排列方式,都需要更多的空间。直到1998年,人们才证明了那种金字塔形的排列——就像超市里堆放的橙子那样——确实是三维空间中的最密堆积方式。
但在更高维度中,球体排列的复杂程度就指数级上升了,因为有更多的排列方式和对称性可供选择。Viazovska用了一个特别优雅的解法,这个解法只存在于八维和二十四维空间中。简单来说,就是把三维空间中最节省空间的排列方式,映射到这些高维空间,然后证明映射过程中产生的间隙,恰好能容纳一个额外的球体。
她首先攻克了八维空间的证明,并因此获得了2022年的菲尔兹奖。随后,她的同事、某机构数学家Henry Cohn说服她,与合作者共同开发二十四维空间的证明。令人惊叹的是,他们在一周内就成功了。
但这些证明,能否被计算机形式化并验证呢?2023年,Viazovska结识了Sidharth Hariharan,当时他正在某机构攻读数学硕士学位,并参与一个名为Lean的形式化项目。两人一拍即合,开始交流想法。“我们只是两个好奇的人,想学点东西——事情就是这样开始的,”Hariharan回忆道。
他们决定,通过将Viazovska证明中引用的每一个术语、定义和定理,都转换成Lean代码,来实现形式化。他们与同事合作,于2025年6月推出了一个网站,用来记录这个庞大的形式化项目。团队把Viazovska的原始工作分解成许多细小的子任务,在线记录下来,并提供协作,以便更大的Lean社区可以认领并处理其中某个子任务。
与此同时,数学家Auguste Poiroux(某机构博士生)在2025年夏末,帮助创立了某机构。“我们希望实现自动将论文或书籍的内容转换为Lean代码,并立即检查,”Poiroux解释道。
某机构注意到了Hariharan及其同事的项目,并主动取得了联系。“2025年秋季,某机构的人告诉我们,他们已经成功形式化了我们项目的较小部分,并与我们分享了一些结果,”现为某机构博士生的Hariharan回忆道。“但之后联系就中断了。我们不知道他们进展到哪一步了——甚至不知道他们是否还在做这个项目。”
“我们当时是个很小的团队,”Poiroux说。“我们意识到,无法同时改进系统和处理Hariharan的项目,所以只能专注于AI。”在接下来的几周里,某机构的团队成员进一步开发了他们的基于智能体的语言模型,并命名为Gauss。
最终,这个软件似乎能够将数学著作转换为Lean代码,并在无需人工干预的情况下自动检查。“我们把Viazovska的八维证明作为测试,”Poiroux说。“突然,系统输出了完整的形式化证明。这完全出乎我们的意料。”
数学的未来
Poiroux和他的同事们自然非常兴奋。但Hariharan的团队心情就复杂得多了。“至少可以说,我们非常惊讶,”Hariharan说。“那是我们的项目,我们投入了两年多的努力——然后某机构把它解决了。”
Hariharan和同事们曾计划将部分形式化工作,作为一名本科生毕业论文的基础。“但我想事情就是这样。AI具有碘伏性,”Hariharan说。
“兴奋之余,我们没有充分考虑后果,”Poiroux坦言。“我理解,从外部看,可能显得我们故意隐瞒了进展。未来我们一定会更加谨慎。”
随后,某机构又攻克了Viazovska的第二个证明,这次是关于二十四维空间中的最优球体堆积。“这一次,我们只把论文给了Gauss,没有别的,”Poiroux说。“系统将其转换成了大约12万行Lean代码。”该代码随后已被验证。
目前,某机构正与Hariharan及其他专家合作,进一步推进自动形式化,并覆盖更多数学领域。“对于许多领域,Lean中仍然缺少基础模块——我们目前还无法形式化那些领域的证明,”Poiroux说。
当数学的大部分领域都能够被形式化时,新的可能性也将随之开启。某机构的系统不仅仅是翻译机器那么简单:它们能够检测并纠正论文中的小错误。这一能力暗示了一种更深远的前景——更高级的AI将监督整个数学领域,甚至在研究中超越人类。
“当我们的模型完整地理解数学时,它们可以以完全不同的方式思考数学,”Poiroux说,“并可能产生全新的成果。”
本文最初发表于《科学光谱》,经授权转载。
