AI掌握宇宙运行规律:棘手问题深度剖析

2026-06-19阅读 0热度 0
人工智能

先看这两张图。它们模拟的是宇宙中同一片区域,但背后是两套不同的“宇宙剧本”。上面那张,是我们熟悉的ΛCDM标准模型;下面那张,则假设宇宙里还藏着大质量的中微子,并且引力法则也略有不同。乍一看差别不大,但正是这些细微之处,隐藏着基础物理变化的蛛丝马迹。图片来源:Francisco Villaescusa Na varro

AI能帮我们更快找到新物理吗?能,而且很便宜。但它有时会被自己学过的“旧知识”框住,反而对眼前真正新鲜的东西视而不见。

一篇发表在《宇宙学与天体粒子物理学杂志》(JCAP)上的新研究,就把这个“双刃剑”效应摆到了台面上。结论是:AI确实能让寻找新物理定律的过程变得更便宜、更快捷,但代价是,它的“过度依赖”可能成为障碍。

如今,AI已经是宇宙学研究的标配,帮科学家们处理海量的天文数据。但问题在于,要想验证那些超越ΛCDM模型的新想法——比如大质量中微子、修正引力、演化暗能量——通常意味着要生成成千上万个“虚拟宇宙”模拟。每个模拟都基于一套不同的物理假设,而这些模拟的计算成本,高得吓人。

ΛCDM模型虽然成功解释了宇宙膨胀、星系大尺度分布等现象,但学界普遍认为,这远不是故事的全貌。上述那些“新物理”候选者,很可能就藏在现有模型无法解释的角落。

为了探明这些可能,研究者不得不生成大量详尽的虚拟宇宙模拟,每个模拟都基于不同的物理假设——而制作这些模拟,通常需要巨大的计算能力和时间。

迁移学习提供了一条更快的路径

有没有更聪明的办法?答案是肯定的。研究人员盯上了一种叫“迁移学习”的机器学习方法。

迁移学习的核心理念很简单:让AI把从一个任务中学到的知识,迁移到另一个相关任务上,而不是每次都“从零开始”。这就像你学完小学数学,再去学代数,总比连加法都不会就直接上手要快得多。

具体到这项研究,团队先用基于ΛCDM模型的模拟数据训练了一个神经网络。这个阶段叫“预训练”,相当于给AI打了基础。之后,再让它接触那些包含可能存在的新物理的、更复杂的宇宙模型。

“这本质上是一条捷径,”该研究的合著者、来自Flatiron研究所和普林斯顿大学的宇宙学家Adrian Bayer解释道,“通常,人们会直接在计算成本最高的模拟上训练AI。而我们的做法是,先用更简单、更便宜的ΛCDM模拟让AI理解大致情况,然后再转向更复杂的模型。”他把这个过程比作从教科书学习:“你先读一本基础书打底,然后再去啃真正复杂的专著。”

论文第一作者、普林斯顿大学本科生Veena Krishnaraj则进一步强调,这种方法能防止AI在一次性面对海量复杂信息时“消化不良”。

事实证明,这个策略相当奏效。在某些案例中,迁移学习竟然把需要的昂贵模拟次数减少了十倍以上,效率惊人。

当先验知识成为问题

不过,硬币总有另一面。这项研究也揭示了一个不那么显而易见的挑战——“负迁移”。

继续用Bayer的教科书类比。想象一个医学生,他学了很多常见病的知识。后来遇到了一种罕见病,症状和某种常见病很像。他已有的知识通常是有用的,但这次,却可能直接把他引向错误的诊断。

AI系统也会掉进同样的坑里。如果“新物理”产生的某些信号,和AI从ΛCDM模型中学到的某种模式长得太像,AI就很容易“先入为主”,用旧知识的滤镜去解读新信息。这样一来,它要想识别出真正不同的东西,就难上加难了。

研究人员在分析包含大质量中微子的模拟数据时,就亲眼目睹了这种效应。原因在于,中微子质量的某些可观测效应,与ΛCDM模型中一个名为σ₈的参数(用于衡量宇宙中物质聚集强度的)带来的变化,相似度极高。

由于这两种效应的“长相”几乎一模一样,那个已经“学成”的神经网络,在初期死活区分不出它们。

“负迁移不是随随便便发生的,”Krishnaraj总结道,“它是由模型中潜在的物理‘简并性’驱动的。”换句话说,不同的物理参数,完全可能产生几乎一致的可观测特征,这让AI很难正确区分。她最后提醒道:“所以,这是我们需要注意并努力去缓解的问题。”

未来宇宙学的前景与风险

这些发现,像一面镜子,既照出了将“基础模型”策略应用于物理学的巨大潜力,也映射出潜在的陷阱。有意思的是,这些方法在概念上,和我们今天熟悉的现代生成式AI、大型语言模型所采用的技术是相通的。

正如作者在论文中指出的:预训练可以加快推理速度,但同时也可能成为学习新物理知识的“绊脚石”。

到目前为止,这套方法还只在模拟数据上进行了测试。不过,研究人员认为,它为未来处理真实天文观测数据,铺下了一块重要的基石。

说到这,我想起一个经典比喻:如果你的脑子里已经装满了锤子,你看所有东西都会像钉子。下一代宇宙学调查即将开启,届时海量前所未有的高精度数据会扑面而来。迁移学习这个方法,如果使用得当,完全可以成为科学家们分析这些信息的“超级翻跟斗”,帮我们在寻找标准模型之外的新物理时走得更远。但前提是,我们必须时刻提防那个叫做“负迁移”的幽灵。

这篇题为《超越标准模型的迁移学习》的论文(作者:Veena Krishnaraj, Adrian E. Bayer, Christian Kragh Jespersen, Peter Melchior)已发表在JSTAT上。

相关知识

宇宙是时间、空间及其中所有物质与能量的总称,包含无数星系、恒星、行星等天体,还有暗物质、暗能量等未知成分。它约138亿年前源于大爆炸,至今仍在膨胀。人类借望远镜等工具持续探索,不断尝试解开其起源、演化与未来的奥秘。

BY: Sissa Medialab

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策