物理信息GNN架构：精准预测多体动力系统

2026-06-11阅读 0热度 0

机器学习

人工智能在图像识别与自然语言处理等领域成绩斐然，但在复杂物理系统建模上，挑战明显升级。现实世界中的颗粒材料运动、分子振动、人体步态、机械系统运转，均属于多体动力学系统。其共性在于：物体之间交互极其复杂，同时必须严格遵守动量守恒、能量守恒等基础物理定律。

传统数值模拟方法虽能实现高精度求解，但代价极高——尤其当需要进行长时间模拟或处理大规模粒子系统时，计算资源消耗巨大。另一方面，机器学习模型虽然擅长从数据中学习复杂映射关系，却往往缺乏物理规律的显式约束，长期预测中误差会逐级累积，甚至导致结果完全发散。

这一困境催生了物理信息机器学习的兴起。其中，基于图神经网络（GNN）的动力学建模方法备受关注。GNN天然适合表征粒子或刚体间的交互：节点代表物体，边代表相互作用力。用它建模多体系统，逻辑自洽。然而，纯数据驱动的普通GNN通常缺乏物理一致性、可解释性与泛化能力。

针对该痛点，瑞士洛桑联邦理工学院的研究人员提出了一种物理信息驱动的GNN新架构——DYNAMI-CAL GraphNet。该模型将GNN的学习能力与基于物理的归纳偏置相结合，核心策略是把线动量和角动量守恒定律直接嵌入模型结构，在架构层面显式保证这两种守恒。

实验结果显示，DYNAMI-CAL GRAPHNET 在机器人技术、航空航天工程、材料科学等需要准确、可解释且实时建模的复杂多体动力系统中优势显著。它不仅能够输出符合基本守恒定律的物理一致预测，还能推算系统中的力与力矩，并高效处理异质交互及外部作用力。

研究成果已发表于 Nature Communications，论文标题为 "A physics-informed graph neural network conserving linear and angular momentum for dynamical systems"。

研究亮点：

DYNAMI-CAL GRAPHNET 在等变 GNN 架构中，通过在内部成对相互作用层面强制执行牛顿第三定律，直接将线动量与角动量守恒融入网络结构。
即使面对复杂的非中心相互作用、耗散作用等情况，仍能输出物理一致的预测，且适用于多种系统类型。
该架构在控制系统设计、机械过程优化，以及自然与工程系统动态行为分析方面具有重要价值。

四类截然不同的动力学系统数据集

为验证模型的通用性，研究团队在四类差异显著的动力学系统数据集上展开实验。这些数据集覆盖从物理模拟到真实世界数据的多种场景。

颗粒 6-DoF 碰撞数据集

研究团队构建了一个六自由度颗粒碰撞系统。在该系统中，每个颗粒既能平移也能旋转，因此具有六个自由度（6-DoF）。

训练数据集包含5条轨迹，每条轨迹含60个相同的球体，这些球体被限制在闭合长方体空间内运动。初始线速度随机设定，数值在1–2 m/s范围内均匀采样。每条轨迹含1500个时间步，数据采样间隔为10⁻⁴秒，底层物理仿真时间步长为10⁻⁶秒。每个时间步记录每个球体的位置、线速度与角速度。

验证集包含1条未参与训练的轨迹，同样由60个球体组成，共200个时间步。初始速度大小仍在训练范围内，但方向不同——用于检验模型泛化能力。

插值测试集设置与验证集相同，但轨迹长度扩展为500个时间步，用于评估模型在训练分布内的长期预测性能。

受约束 N 体系统

针对经典的受约束N体动力学问题，研究人员采用文献中提出的 Constrained N-Body 数据集。该数据集在 Thomas Kipf 等人构建的三维带电粒子模拟基础上进行扩展，通过引入刚性杆（sticks）与铰链（hinges）形式的完整约束来构建系统，旨在评估模型在混合交互类型及结构约束系统中的适用性。

人体运动捕捉数据

第三个数据集源自真实世界的人体运动数据——CMU Motion Capture Database。它记录了人体骨骼关节在行走、跑步、跳跃等运动中的三维位置变化。实验中，研究人员选取受试者的“行走”数据，将人体骨骼关节建模为图结构：节点表示关节，边表示骨骼连接。该实验主要用于验证模型在真实复杂运动系统中的表现。

蛋白质分子动力学

最后一个数据集来自蛋白质分子动力学模拟。研究人员使用 apo 腺苷酸激酶（AdK）平衡轨迹数据集，通过 MDAnalysis 工具包获取，记录了蛋白质在显式水分子与离子环境中的原子级运动。

DYNAMI-CAL GraphNet：一种物理信息驱动的 GNN 新型架构

DYNAMI-CAL GraphNet 的核心设计是将物理守恒定律直接嵌入神经网络结构。整体架构分为三个阶段：图表示、具有线动量与角动量守恒的标量化–向量化方案、以及时空消息传递。

DYNAMI-CAL GRAPHNET 模型整体架构与数据流

第一阶段：图表示（Graph Representation）

首先，将多体系统表示为图：节点代表物体或粒子，边代表物体之间的相互作用。每个节点包含多项特征，如位置、速度、角速度、物体属性（质量、电荷等）；边则表示两物体间的相对位置与交互关系。

第二阶段：标量化–向量化（Scalarization-Vectorization）

* 标量化（Scalarization）

在标量化阶段，模型将节点和边的向量信息转换为高维标量嵌入。一个关键创新是：每条边都会分配一个局部正交参考坐标系。该坐标系的性质包括：对3D旋转 SO(3) 等变，对平移 T(3) 不变，在节点交换时反对称——即当边方向反转时，三个基向量均改变符号，从而确保所有后续投影与交互计算满足反对称性。

在标量化步骤中，节点向量特征（如速度和角速度）被投影到这些边局部坐标系中，得到标量分量。这些标量随后与其他节点标量特征结合，形成对节点顺序不敏感的边嵌入。该方法在保持系统对称性的同时，也编码了局部相互作用的方向信息与标量信息。

* 向量化（Vectorization）

在向量化阶段，模型从边的嵌入向量中解码出内部作用力及旋转力矩，这些力随后被聚合到节点上，用于更新粒子的线速度、角速度和位置。由于模型设计中强制力和力矩满足反对称关系，系统天然满足线动量守恒和角动量守恒。

第三阶段：时空消息传递（Spatiotemporal Message Passing）

在每条边上计算出物理一致的内部力和力矩之后，模型执行 DYNAMI-CAL GRAPHNET 的时空消息传递机制。

首先，将解码得到的边级内部力和旋转力矩在连接节点上进行聚合，得到每个节点所受合力和合力矩。然后，这些向量乘以由节点标量嵌入得到的系数，从而更新节点的线速度与角速度，接着用隐式欧拉积分计算更新后的位置。这一过程构成了 DYNAMI-CAL GRAPHNET 的一个消息传递层。

在下一轮边编码中，逐步演化的表示将作为每条边的潜在记忆（latent memory）保留，从而使模型能够实现真正的时空推理。

这种设计使得 DYNAMI-CAL GRAPHNET 能在多个时间尺度上捕捉系统的动态行为，同时在每一步计算中维持基于物理规律的归纳偏置。

实验结论：稳定性与泛化能力显著提升

研究团队在四个基准任务上评估了 DYNAMI-CAL GRAPHNET 的性能，这些任务涵盖模拟物理系统与真实世界物理系统。多个数据集上的实验表明，DYNAMI-CAL GraphNet 在多项指标上优于现有方法。

颗粒 6-DoF 碰撞基准（Granular 6-DoF collision benchmark）

在长方体容器中对60个球体的6自由度（6-DoF）运动进行滚动预测实验，下图展示了 DYNAMI-CAL GRAPHNET 与 GNS 的对比：

受限颗粒碰撞的长时序滚动预测

DYNAMI-CAL GRAPHNET 成功保留了所有粒子，准确跟踪了动能衰减，在500步预测中保持了动量演化一致性，不同随机种子下方差极小。相比之下，GNS 在外推场景中较早出现发散，且存在粒子逃逸。原因在于高动量条件下碰撞速度增加，需要精确计算冲量接触力才能维持系统约束，而 GNS 难以泛化——即使未逃逸的粒子，其预测也逐渐偏离真实物理行为。

这些结果表明，DYNAMI-CAL GRAPHNET 在建模耗散型、接触密集的6-DoF动力系统时，鲁棒性与泛化能力明显更强。

受约束的 N 体动力学（Constrained N-body dynamics）

总体来看，DYNAMI-CAL GRAPHNET 在单步预测和多步预测任务中均优于所有基线模型。

下图 a 中，DYNAMI-CAL GRAPHNET 在各种配置下均取得了最低的单步预测误差，性能优于 GMN、EGNN 和 ClofNet。随后，研究人员引入随机旋转与平移增强，显著提升了非等变 GNN 的性能，缩小了与等变模型之间的差距。但值得注意的是，即使数据量增加且模型显式接触了几何对称性，GNN (aug.) 仍然在所有测试配置中落后于最简单的等变模型 EGNN 和 DYNAMI-CAL GRAPHNET。

这意味着，架构中的归纳偏置（inductive bias）对于泛化受约束物理动力学仍然至关重要。

约束 N 体基准测试中的性能表现（单步预测误差）

对于多步滚动预测（multi-step rollout prediction），下图 b 将 DYNAMI-CAL GRAPHNET 与 GMN 做了比较。结果表明，在最长4步的多步滚动预测（1步=10帧=1000次仿真步）中，DYNAMI-CAL GRAPHNET 能够保持稳定的长期预测精度；而 GMN 的预测误差则会随步长逐渐累积并显著增大。

约束 N 体基准测试中的性能表现（多步滚动预测）

下图 c 展示了在未见过的 (1, 0, 3) 结构配置上的定性滚动预测结果。尽管模型仅在不同拓扑结构的数据上通过单步监督进行训练，研究提出的方法仍能准确捕捉受约束系统的动力学行为。

约束 N 体基准测试中的性能表现（定性滚动结果）

人体运动预测

在人体运动捕捉数据上，尽管模型只使用单步监督训练，但在多步预测中仍能保持稳定轨迹——这表明模型成功学习到了人体运动中的时空动力学结构。

下图 a 展示了 CMU 人体步行基准上的单步预测精度。结果表明，DYNAMI-CAL GRAPHNET 在所有方法中取得最低误差，优于 GMN。GMN 使用19个关节表示人体骨架，并通过6条人工定义的刚性连接，再通过手工设计的正向运动学模块强制执行约束。

CMU 运动捕捉基准测试（受试者 #35，步行）的性能表现（单步预测误差）

下图 b 表明，尽管模型仅使用单步监督训练，DYNAMI-CAL GRAPHNET 在多步滚动预测中仍能保持稳定精度，而 GMN 很快出现发散。

CMU 运动捕捉基准测试（受试者 #35，步行）的性能表现（多步滚动预测误差）

下图 c 的定性结果进一步说明：预测得到的关节轨迹连续一致，物理上合理，且与真实运动高度一致，在90帧未来预测中仍能保持稳定。

CMU 运动捕捉基准测试（受试者 #35，步行）的性能表现（定性滚动预测结果）

蛋白质动力学

最后，研究团队还评估了模型对复杂、由热扰动驱动的蛋白质动力学的建模能力。结果表明，DYNAMI-CAL GRAPHNET 在复杂细粒度系统（如蛋白质）中展现了卓越的动力学建模能力。它不仅能够捕捉微观结构振动，还能预测大尺度构象变化，预测精度超过多种基线方法。

从物理模拟到具身智能的世界模型

随着人工智能技术演进，“具身智能”这一研究方向迅速升温。与传统AI主要处理文本或图像不同，具身智能强调智能体与真实物理世界的交互能力——机器人、自动驾驶系统、智能制造设备均属于重要应用场景。在这些系统中，智能体不仅需要感知环境，还需预测环境变化并据此制定行动策略。这要求它具备一种能力：理解并预测物理世界的动态行为。

近年来，“世界模型”概念被广泛提及。简言之，世界模型是一个能模拟环境动态变化的内部模型，让智能体可以在“脑海”中预演未来。但构建真实可靠的世界模型并不容易。现实物体运动通常受复杂物理规律约束，如动量守恒、摩擦力、碰撞动力学——若模型无法准确刻画这些规律，预测结果极易在多步推理中逐渐偏离现实。

在此背景下，像 DYNAMI-CAL GraphNet 这样的物理信息神经网络，为具身智能的发展提供了一种新的技术思路。

此外，业界在高效、精确预测复杂物理系统演化方面也取得了重要进展。物理系统往往跨越多个时间尺度和空间尺度演化，而大多数学习模型通常只在短期动力学上训练，一旦用于长时间尺度预测，误差便会在复杂系统中不断累积，导致模型不稳定。

针对这一挑战，来自 Polymathic AI 协作组的研究团队引入了一系列新方法。他们提出了一个拥有13亿参数、以Transformer为核心架构、主要面向类流体连续介质动力学的基础模型——Walrus。Walrus在预训练阶段覆盖了19种高度多样化的物理场景，涵盖天体物理、地球科学、流变学、等离子体物理、声学以及经典流体力学等领域。实验结果表明，无论在下游任务的短期预测还是长期预测中，Walrus均优于此前的基础模型，并在整个预训练数据分布范围内展现出更强的泛化性能。

* 论文标题：Walrus: A Cross-Domain Foundation Model for Continuum Dynamics
* 论文链接：https://arxiv.org/abs/2511.15684

物理AI模型的构筑，一方面能帮助科学家更高效地模拟复杂系统——例如分子动力学、材料科学和气候模型；另一方面，也为智能机器人提供更真实的世界理解能力。从某种意义上说，让人工智能真正理解物理世界，或许正是迈向通用人工智能的重要一步。

参考文献：
1. https://www.nature.com/articles/s41467-025-67802-5