最新GPT-5仅18分钟解黑洞方程,效率碾压人类数月
2026年,科学研究的范式正在悄然改变。人工智能,这位曾经的“辅助工具”,如今正以“合作者”的身份,深度介入从数学证明到黑洞物理的前沿探索。它带来的不仅是效率的提升,更是一种思维模式的拓展——科学加速的时代,已然拉开序幕。
从三个夜晚到一页证明:AI如何成为数学家的“思维翻跟斗”
数学,被誉为科学的皇后,向来是对人类智力极限的终极考验。就在两年前,大语言模型还在基础算术上磕磕绊绊;而如今,顶尖模型已能在国际数学奥林匹克竞赛中摘得金牌。这种进步的速度,堪比一年前AI还只能补全代码行,如今却能独立开发完整应用程序的飞跃。
数学家Ernest Ryu的经历,是这一转变的生动注脚。2024年,他曾尝试让ChatGPT解决一个复杂的棒球赛季赛程安排问题,其中涉及大量硬性约束和软性优化目标。当时的模型在处理这类多约束复杂问题时仍显稚嫩,时常遗漏关键条件,最终未能成功。
然而,2025年AI在奥赛中的惊艳表现,让Ryu看到了其潜力的巨大跃迁。他首先将AI用于日常学术工作,比如在编写讲义时,询问那些他确信为真但一时难以完整回忆证明过程的定理。在获得积极反馈后,他决定迈出更大的一步:将AI引入真正的学术研究。
他选择的目标,是一个与“Nesterov加速”这一经典优化技术相关的、悬而未决的开放性问题。接下来的三个晚上,一场密集的人机协作攻关展开了。
AI首先给出了一个包含计算错误的初始证明思路。Ryu的工作并非简单地接受或拒绝,而是扮演一位高明的向导:他纠正错误,在持续增长的对话中保留正确的中间步骤,果断放弃走入死胡同的路径,并将模型的注意力引导向新的可能性。
他将这个过程比作“走迷宫”——在不断转弯、尝试开门的过程中,同时在心里绘制着一幅标记了失败路径和希望之路的地图。他感到,ChatGPT将他探索迷宫的速度提升了3到10倍。
关键的突破发生在第三个晚上。AI完成了一次微小的、但至关重要的思维跃迁,其产生的论证“看起来有所不同”。正是这一点“不同”,成为了解开整个证明的钥匙。
出于科学家的严谨,Ryu“反复检查了不止三遍”,并请学生进行独立验证。随后,他将这一成果分享给优化领域的同行,引发了广泛的惊讶与兴奋。最终,他们通过一个精炼的提示,将连续时间下的理论结果转化为了离散时间的实用算法陈述,其中最具创新性的核心部分,被凝练成了仅仅一页纸的内容,达到了可发表的水平。
这次成功的合作,也改变了Ryu的职业轨迹。此后,他加入了OpenAI的合成数据团队,其核心使命正是继续提升模型的数学推理能力。
跨越学科的“加速”:从黑洞对称性到蛋白质设计
AI带来的“加速”效应,正在各个基础科学领域百花齐放。
理论物理学家Alex Lupsasca的经历颇具代表性。他曾花费数年时间培养相关数学技能,又投入了数月进行集中攻关,才最终推导出描述黑洞潮汐响应的重要方程。出于好奇,他将这个方程交给了GPT-5 Pro,并只给予了最少的背景指导。模型进入了“思考”模式。大约18分钟后,它返回了结果——完全相同的对称性生成元。
AI在短短18分钟内,重现了他凭借深厚积累和长期努力才获得的关键发现。这一震撼体验促使Lupsasca也加入了OpenAI。他现在的目标,是推动AI在科研中的应用从一次性的“奇迹时刻”,迈向可重复、系统化的“科学加速”。他正致力于开发更强大的工具来阅读和解释学术论文,构建比单一聊天窗口更复杂的工作流,将前沿物理学的知识更深地嵌入模型。最终目的,是让研究人员能花更少时间纠缠于复杂的代数推导,而将更多精力聚焦于识别和攻克那些困扰物理学界的根本性谜题。
在生命科学领域,OpenAI与RetroBioSciences的合作则展示了AI解决具体生物学难题的潜力。RetroBio的目标是使细胞重编程技术变得实用和可扩展,以期应用于延长健康寿命。细胞重编程通常使用四种“OSKM”因子来重置细胞的衰老特征,但在老年细胞中,这一过程会显著变慢。
为了找到能加速这一过程的新蛋白质,OpenAI构建了专用基础模型GPT-4B Micro。与通用模型不同,它在海量的多模态生物数据上进行了深度训练。
GPT-4B Micro生成了数千个候选蛋白质序列。经过筛选,RetroBio合成了最有希望的序列,并通过慢病毒载体将其递送到人类成纤维细胞中进行测试。后续实验表明,AI设计出的某些蛋白质,其性能与之前人工设计的最佳因子相当,甚至在部分指标上实现了超越。
科学家如何与AI“并肩作战”?
2026年1月,OpenAI发布的《AI作为科学合作者》白皮书,通过一系列鲜活案例指出,对于前沿科学家而言,AI已经可以成为一个真正并肩作战的科研伙伴。
数据揭示了这一趋势的广度:每周,ChatGPT上会产生840万条关于高级科学和数学话题的对话,这些对话来自全球130万活跃用户。仅在2025年,与高级科学相关的消息数量就暴涨了50%。
科学家们使用AI的方式与普通用户有着显著区别:他们更为专注和深入。平均而言,科研用户的消息量是普通用户的3.5倍,其中编程相关消息的频率高出12倍。他们的工作流高度集中在几个核心领域:代码生成与调试、复杂数据分析、数学公式推导以及文献综述与理解。
OpenAI科学部门副总裁Kevin Weil断言,AI正越来越多地被用作真正的科学合作者。在真实的研究环境中,其影响力日益凸显,科学正在进入一个全新的加速阶段。而OpenAI所描绘的愿景,是为每一位科学家配备AI赋予的“超能力”,以期在2030年达成原本预计2050年才能实现的科学水平。
未来十年,科学发现的速度或将超越过去百年。这场由人机协作驱动的知识革命,值得我们共同期待。






