AI探索宇宙新物理:隐藏陷阱与挑战深度解析
标准宇宙模型(即ΛCDM模型)成功解释了大尺度结构、宇宙膨胀以及星系分布等诸多宏观特征。听起来颇具说服力,但研究者清楚,这远非终极答案——暗物质粒子的真实性质、暗能量的物理本质,仍是悬而未决的核心问题。
宇宙学前沿探索中,人工智能正成为科学家高效协作的利器。近期一项研究指出,机器学习中的“迁移学习”技术有望以更快速、更低成本的路径,引导发现超越标准模型的新物理学。迁移学习究竟有何独特优势?
然而,这项研究也揭示了一个意料之外的局限:AI在训练中过度依赖已有知识,当真正新颖的现象出现时,反而难以识别。该论文已发表于《宇宙学和天体粒子物理学杂志》。
论文地址:https://iopscience.iop.org/article/10.1088/1475-7516/2026/06/026
迁移学习:降本增效的关键技术
近年宇宙学观测数据激增,多项独立测量结果与标准宇宙模型出现偏差。这些偏离暗示可能存在新物理机制——例如大质量中微子、修正引力、或暗能量的动态演化。
为验证这些假说,研究者需要生成海量高精度计算机模拟,每个模拟代表一种不同物理假设下的“虚拟宇宙”。然而,生成这些模拟的计算成本极高,常需消耗天文级资源。
迁移学习在此处发挥关键作用:将从一个任务学到的知识迁移至另一任务,使目标训练更灵活、高效。研究团队的具体做法是:先用相对简单的ΛCDM模拟对神经网络进行“预训练”,打下基础;再引入包含新物理的复杂模拟进行“微调”。
研究成员、普林斯顿大学宇宙学家Adrian E. Bayer用一个比喻勾勒了策略精髓:“先读基础教材形成全局认知,再啃复杂专著。”该方法显著降低了AI一次性消化所有信息的负担,效果惊人——在某些场景下,高成本模拟数量减少超过90%。
效率捷径下的隐藏风险
尽管迁移学习大幅提升效率,研究团队指出,这条捷径在充满未知的宇宙探索中并不完美。可以类比:你掌握大量常见病诊断,但遇到症状相似却极为罕见的疾病时,可能误判为常规病症。
AI面临类似问题:新物理学的特征有时与标准模型的某些模式高度重合。经过预训练的神经网络会不自觉地用已有知识解读不熟悉的信息,而恰恰是这些“异常信息”中隐藏着新物理的关键线索。
团队在模拟大质量中微子过程中亲眼验证了该效应。中微子质量引发的某些效应与ΛCDM参数σ8(描述物质聚集强度的指标)几乎无法区分,预训练神经网络完全无法分辨。
以下两幅图来自研究使用的Quijote模拟,展示同一宇宙区域但对应不同宇宙学模型。上图是ΛCDM模型,下图包含大质量中微子和修正引力。差异极其细微,却揭示了影响宇宙结构形成与分布的物理机制变化。
该发现暴露了一个深层问题:基础模型理念在物理学中的应用兼具优势与局限。论文直言:“预训练可加速推理,但同时可能阻碍对新物理现象的学习。” 科学发现的本质在于不断拓展认知边界。AI固然高效,但若过度依赖已有知识,便易陷入经验主义——善于拟合已知,怯于触碰未知。而真正的突破,往往隐藏于反常与例外之中。
参考链接:https://www.sciencedaily.com/releases/2026/06/260611024557.htm