物理信息GNN架构:精准预测多体动力系统
人工智能在图像识别与自然语言处理等领域成绩斐然,但在复杂物理系统建模上,挑战明显升级。现实世界中的颗粒材料运动、分子振动、人体步态、机械系统运转,均属于多体动力学系统。其共性在于:物体之间交互极其复杂,同时必须严格遵守动量守恒、能量守恒等基础物理定律。
传统数值模拟方法虽能实现高精度求解,但代价极高——尤其当需要进行长时间模拟或处理大规模粒子系统时,计算资源消耗巨大。另一方面,机器学习模型虽然擅长从数据中学习复杂映射关系,却往往缺乏物理规律的显式约束,长期预测中误差会逐级累积,甚至导致结果完全发散。
这一困境催生了物理信息机器学习的兴起。其中,基于图神经网络(GNN)的动力学建模方法备受关注。GNN天然适合表征粒子或刚体间的交互:节点代表物体,边代表相互作用力。用它建模多体系统,逻辑自洽。然而,纯数据驱动的普通GNN通常缺乏物理一致性、可解释性与泛化能力。
针对该痛点,瑞士洛桑联邦理工学院的研究人员提出了一种物理信息驱动的GNN新架构——DYNAMI-CAL GraphNet。该模型将GNN的学习能力与基于物理的归纳偏置相结合,核心策略是把线动量和角动量守恒定律直接嵌入模型结构,在架构层面显式保证这两种守恒。
实验结果显示,DYNAMI-CAL GRAPHNET 在机器人技术、航空航天工程、材料科学等需要准确、可解释且实时建模的复杂多体动力系统中优势显著。它不仅能够输出符合基本守恒定律的物理一致预测,还能推算系统中的力与力矩,并高效处理异质交互及外部作用力。
研究成果已发表于 Nature Communications,论文标题为 "A physics-informed graph neural network conserving linear and angular momentum for dynamical systems"。
研究亮点:
- DYNAMI-CAL GRAPHNET 在等变 GNN 架构中,通过在内部成对相互作用层面强制执行牛顿第三定律,直接将线动量与角动量守恒融入网络结构。
- 即使面对复杂的非中心相互作用、耗散作用等情况,仍能输出物理一致的预测,且适用于多种系统类型。
- 该架构在控制系统设计、机械过程优化,以及自然与工程系统动态行为分析方面具有重要价值。
四类截然不同的动力学系统数据集
为验证模型的通用性,研究团队在四类差异显著的动力学系统数据集上展开实验。这些数据集覆盖从物理模拟到真实世界数据的多种场景。
颗粒 6-DoF 碰撞数据集
研究团队构建了一个六自由度颗粒碰撞系统。在该系统中,每个颗粒既能平移也能旋转,因此具有六个自由度(6-DoF)。
训练数据集包含5条轨迹,每条轨迹含60个相同的球体,这些球体被限制在闭合长方体空间内运动。初始线速度随机设定,数值在1–2 m/s范围内均匀采样。每条轨迹含1500个时间步,数据采样间隔为10⁻⁴秒,底层物理仿真时间步长为10⁻⁶秒。每个时间步记录每个球体的位置、线速度与角速度。
验证集包含1条未参与训练的轨迹,同样由60个球体组成,共200个时间步。初始速度大小仍在训练范围内,但方向不同——用于检验模型泛化能力。
插值测试集设置与验证集相同,但轨迹长度扩展为500个时间步,用于评估模型在训练分布内的长期预测性能。
受约束 N 体系统
针对经典的受约束N体动力学问题,研究人员采用文献中提出的 Constrained N-Body 数据集。该数据集在 Thomas Kipf 等人构建的三维带电粒子模拟基础上进行扩展,通过引入刚性杆(sticks)与铰链(hinges)形式的完整约束来构建系统,旨在评估模型在混合交互类型及结构约束系统中的适用性。
人体运动捕捉数据
第三个数据集源自真实世界的人体运动数据——CMU Motion Capture Database。它记录了人体骨骼关节在行走、跑步、跳跃等运动中的三维位置变化。实验中,研究人员选取受试者的“行走”数据,将人体骨骼关节建模为图结构:节点表示关节,边表示骨骼连接。该实验主要用于验证模型在真实复杂运动系统中的表现。
蛋白质分子动力学
最后一个数据集来自蛋白质分子动力学模拟。研究人员使用 apo 腺苷酸激酶(AdK)平衡轨迹数据集,通过 MDAnalysis 工具包获取,记录了蛋白质在显式水分子与离子环境中的原子级运动。
DYNAMI-CAL GraphNet:一种物理信息驱动的 GNN 新型架构
DYNAMI-CAL GraphNet 的核心设计是将物理守恒定律直接嵌入神经网络结构。整体架构分为三个阶段:图表示、具有线动量与角动量守恒的标量化–向量化方案、以及时空消息传递。
DYNAMI-CAL GRAPHNET 模型整体架构与数据流
第一阶段:图表示(Graph Representation)
首先,将多体系统表示为图:节点代表物体或粒子,边代表物体之间的相互作用。每个节点包含多项特征,如位置、速度、角速度、物体属性(质量、电荷等);边则表示两物体间的相对位置与交互关系。
第二阶段:标量化–向量化(Scalarization-Vectorization)
* 标量化(Scalarization)
在标量化阶段,模型将节点和边的向量信息转换为高维标量嵌入。一个关键创新是:每条边都会分配一个局部正交参考坐标系。该坐标系的性质包括:对3D旋转 SO(3) 等变,对平移 T(3) 不变,在节点交换时反对称——即当边方向反转时,三个基向量均改变符号,从而确保所有后续投影与交互计算满足反对称性。
在标量化步骤中,节点向量特征(如速度和角速度)被投影到这些边局部坐标系中,得到标量分量。这些标量随后与其他节点标量特征结合,形成对节点顺序不敏感的边嵌入。该方法在保持系统对称性的同时,也编码了局部相互作用的方向信息与标量信息。
* 向量化(Vectorization)
在向量化阶段,模型从边的嵌入向量中解码出内部作用力及旋转力矩,这些力随后被聚合到节点上,用于更新粒子的线速度、角速度和位置。由于模型设计中强制力和力矩满足反对称关系,系统天然满足线动量守恒和角动量守恒。
第三阶段:时空消息传递(Spatiotemporal Message Passing)
在每条边上计算出物理一致的内部力和力矩之后,模型执行 DYNAMI-CAL GRAPHNET 的时空消息传递机制。
首先,将解码得到的边级内部力和旋转力矩在连接节点上进行聚合,得到每个节点所受合力和合力矩。然后,这些向量乘以由节点标量嵌入得到的系数,从而更新节点的线速度与角速度,接着用隐式欧拉积分计算更新后的位置。这一过程构成了 DYNAMI-CAL GRAPHNET 的一个消息传递层。
在下一轮边编码中,逐步演化的表示将作为每条边的潜在记忆(latent memory)保留,从而使模型能够实现真正的时空推理。
这种设计使得 DYNAMI-CAL GRAPHNET 能在多个时间尺度上捕捉系统的动态行为,同时在每一步计算中维持基于物理规律的归纳偏置。
实验结论:稳定性与泛化能力显著提升
研究团队在四个基准任务上评估了 DYNAMI-CAL GRAPHNET 的性能,这些任务涵盖模拟物理系统与真实世界物理系统。多个数据集上的实验表明,DYNAMI-CAL GraphNet 在多项指标上优于现有方法。
颗粒 6-DoF 碰撞基准(Granular 6-DoF collision benchmark)
在长方体容器中对60个球体的6自由度(6-DoF)运动进行滚动预测实验,下图展示了 DYNAMI-CAL GRAPHNET 与 GNS 的对比:
受限颗粒碰撞的长时序滚动预测
DYNAMI-CAL GRAPHNET 成功保留了所有粒子,准确跟踪了动能衰减,在500步预测中保持了动量演化一致性,不同随机种子下方差极小。相比之下,GNS 在外推场景中较早出现发散,且存在粒子逃逸。原因在于高动量条件下碰撞速度增加,需要精确计算冲量接触力才能维持系统约束,而 GNS 难以泛化——即使未逃逸的粒子,其预测也逐渐偏离真实物理行为。
这些结果表明,DYNAMI-CAL GRAPHNET 在建模耗散型、接触密集的6-DoF动力系统时,鲁棒性与泛化能力明显更强。
受约束的 N 体动力学(Constrained N-body dynamics)
总体来看,DYNAMI-CAL GRAPHNET 在单步预测和多步预测任务中均优于所有基线模型。
下图 a 中,DYNAMI-CAL GRAPHNET 在各种配置下均取得了最低的单步预测误差,性能优于 GMN、EGNN 和 ClofNet。随后,研究人员引入随机旋转与平移增强,显著提升了非等变 GNN 的性能,缩小了与等变模型之间的差距。但值得注意的是,即使数据量增加且模型显式接触了几何对称性,GNN (aug.) 仍然在所有测试配置中落后于最简单的等变模型 EGNN 和 DYNAMI-CAL GRAPHNET。
这意味着,架构中的归纳偏置(inductive bias)对于泛化受约束物理动力学仍然至关重要。
约束 N 体基准测试中的性能表现(单步预测误差)
对于多步滚动预测(multi-step rollout prediction),下图 b 将 DYNAMI-CAL GRAPHNET 与 GMN 做了比较。结果表明,在最长4步的多步滚动预测(1步=10帧=1000次仿真步)中,DYNAMI-CAL GRAPHNET 能够保持稳定的长期预测精度;而 GMN 的预测误差则会随步长逐渐累积并显著增大。
约束 N 体基准测试中的性能表现(多步滚动预测)
下图 c 展示了在未见过的 (1, 0, 3) 结构配置上的定性滚动预测结果。尽管模型仅在不同拓扑结构的数据上通过单步监督进行训练,研究提出的方法仍能准确捕捉受约束系统的动力学行为。
约束 N 体基准测试中的性能表现(定性滚动结果)
人体运动预测
在人体运动捕捉数据上,尽管模型只使用单步监督训练,但在多步预测中仍能保持稳定轨迹——这表明模型成功学习到了人体运动中的时空动力学结构。
下图 a 展示了 CMU 人体步行基准上的单步预测精度。结果表明,DYNAMI-CAL GRAPHNET 在所有方法中取得最低误差,优于 GMN。GMN 使用19个关节表示人体骨架,并通过6条人工定义的刚性连接,再通过手工设计的正向运动学模块强制执行约束。
CMU 运动捕捉基准测试(受试者 #35,步行)的性能表现(单步预测误差)
下图 b 表明,尽管模型仅使用单步监督训练,DYNAMI-CAL GRAPHNET 在多步滚动预测中仍能保持稳定精度,而 GMN 很快出现发散。
CMU 运动捕捉基准测试(受试者 #35,步行)的性能表现(多步滚动预测误差)
下图 c 的定性结果进一步说明:预测得到的关节轨迹连续一致,物理上合理,且与真实运动高度一致,在90帧未来预测中仍能保持稳定。
CMU 运动捕捉基准测试(受试者 #35,步行)的性能表现(定性滚动预测结果)
蛋白质动力学
最后,研究团队还评估了模型对复杂、由热扰动驱动的蛋白质动力学的建模能力。结果表明,DYNAMI-CAL GRAPHNET 在复杂细粒度系统(如蛋白质)中展现了卓越的动力学建模能力。它不仅能够捕捉微观结构振动,还能预测大尺度构象变化,预测精度超过多种基线方法。
从物理模拟到具身智能的世界模型
随着人工智能技术演进,“具身智能”这一研究方向迅速升温。与传统AI主要处理文本或图像不同,具身智能强调智能体与真实物理世界的交互能力——机器人、自动驾驶系统、智能制造设备均属于重要应用场景。在这些系统中,智能体不仅需要感知环境,还需预测环境变化并据此制定行动策略。这要求它具备一种能力:理解并预测物理世界的动态行为。
近年来,“世界模型”概念被广泛提及。简言之,世界模型是一个能模拟环境动态变化的内部模型,让智能体可以在“脑海”中预演未来。但构建真实可靠的世界模型并不容易。现实物体运动通常受复杂物理规律约束,如动量守恒、摩擦力、碰撞动力学——若模型无法准确刻画这些规律,预测结果极易在多步推理中逐渐偏离现实。
在此背景下,像 DYNAMI-CAL GraphNet 这样的物理信息神经网络,为具身智能的发展提供了一种新的技术思路。
此外,业界在高效、精确预测复杂物理系统演化方面也取得了重要进展。物理系统往往跨越多个时间尺度和空间尺度演化,而大多数学习模型通常只在短期动力学上训练,一旦用于长时间尺度预测,误差便会在复杂系统中不断累积,导致模型不稳定。
针对这一挑战,来自 Polymathic AI 协作组的研究团队引入了一系列新方法。他们提出了一个拥有13亿参数、以Transformer为核心架构、主要面向类流体连续介质动力学的基础模型——Walrus。Walrus在预训练阶段覆盖了19种高度多样化的物理场景,涵盖天体物理、地球科学、流变学、等离子体物理、声学以及经典流体力学等领域。实验结果表明,无论在下游任务的短期预测还是长期预测中,Walrus均优于此前的基础模型,并在整个预训练数据分布范围内展现出更强的泛化性能。
* 论文标题:Walrus: A Cross-Domain Foundation Model for Continuum Dynamics
* 论文链接:https://arxiv.org/abs/2511.15684
物理AI模型的构筑,一方面能帮助科学家更高效地模拟复杂系统——例如分子动力学、材料科学和气候模型;另一方面,也为智能机器人提供更真实的世界理解能力。从某种意义上说,让人工智能真正理解物理世界,或许正是迈向通用人工智能的重要一步。
参考文献:
1. https://www.nature.com/articles/s41467-025-67802-5








