Nat. Commun. 前沿解读:扩散模型如何革新DNA折纸设计

2026-05-26阅读 0热度 0
dna

生成式AI在蛋白质设计领域成果斐然,但在DNA折纸结构设计上却进展迟缓。核心障碍在于缺乏大规模、标准化的真实结构数据集,这直接制约了高质量生成模型的训练。然而,一项最新研究通过创新的方法,为这一困境提供了突破性的解决方案。

研究团队开发了名为Generative SNUPI的生成式设计框架。该框架基于扩散模型,能够依据用户定义的目标几何轮廓,自动生成物理上可实现的DNA折纸结构。该系统已成功完成逾百种结构的设计与测试,其中多项设计经实验验证,成功折叠并展现出负泊松比变形、模块化组装等高级功能。这标志着生成式AI有潜力彻底打破DNA折纸的设计局限,为构建复杂、可重构的纳米系统开辟全新道路。

DNA折纸技术的原理,是利用DNA碱基间精准的互补配对规则,在纳米尺度上编程构建出预设形状与功能的结构。过去十多年,该技术已在分子机器人、纳米器件、生物医学应用及动态纳米系统等多个前沿领域证明了其价值。

然而,传统DNA折纸设计严重依赖规则的晶格和固定的交叉点布局。这种范式虽然成熟稳定,但在面对复杂自由曲线、需动态变形的结构或高度不规则的几何体时,其设计能力便捉襟见肘。许多复杂构型的设计,至今仍严重依赖专家的手动调整与经验性试错。

与此同时,以扩散模型为代表的生成式AI,在蛋白质与小分子设计领域已展现出颠覆性的创造能力。例如,RFdiffusion等模型已能实现从随机噪声直接生成全新的蛋白质结构。相比之下,DNA纳米结构领域的AI应用明显滞后。其根本瓶颈,在于数据。

与拥有海量实验解析结构的蛋白质数据库不同,DNA折纸的实验结构数据极为稀缺,且结构表示方法不一,难以直接用于深度学习模型训练。为此,研究人员提出了一个巧妙的替代方案:既然实验数据不足,便转向物理模拟来“生成”数据。通过大规模生成DNA折纸的平衡构象,构建标准化的训练数据集,从而让扩散模型学习到DNA纳米结构内在的几何规律与物理直觉。

方法:构建生成式设计闭环

Generative SNUPI框架的核心,是一个在碱基对层面学习DNA折纸三维结构分布的DDPM扩散模型。

其训练数据来源于450个通过SNUPI多尺度模拟系统获得的DNA线框折纸平衡构象。每个结构中的碱基对均以三维坐标表示,整个DNA结构被视作一个点云进行学习。

训练过程模拟了“破坏与重建”的范式:模型首先学习如何将真实结构逐步添加高斯噪声,直至退化为随机点云;随后再学习如何从这团噪声中,逐步逆向恢复出原始的真实结构。为确保生成结构在三维空间中的几何一致性,模型采用了SE(3)-等变Transformer架构,使其天生具备旋转和平移不变性。

在生成阶段,流程变得高度自动化。用户仅需输入一个目标线条图形——可以是手绘草图、CAD图纸或AI生成的图案。扩散模型将以此作为条件,从随机噪声开始,逐步“描绘”出符合目标形状的DNA结构点云。随后,自动化的DNA链路由算法会接手,生成精确的骨架路径和订书钉序列。

最后,SNUPI模拟系统会对生成结构的稳定性、柔性和热波动特性进行初步评估。整个流程构成了一个从创意输入、结构生成到物理评估的完整闭环,旨在大幅降低后续湿实验的试错成本。

图1:Generative SNUPI整体工作流程。

结果:从理论到实践的跨越

生成式设计成为现实

研究首先验证了Generative SNUPI全流程的可行性。该系统能够处理从简单轮廓、生物启发图形到复杂的剪纸/折纸超材料等多种线条图案。生成的三维点云结构经路由算法处理后,可直接输出原子精度的DNA折纸模型。将物理模拟整合进设计前端,意味着在设计阶段即可预测结构的稳定性和柔性,这是一个关键性进步。

高保真结构的稳定生成

模型生成的结构质量究竟如何?核心在于它是否真正掌握了DNA结构的底层分布规律,而非对训练集的简单记忆。

研究人员对100种不同尺寸和复杂度的结构进行了测试。结果显示,初始目标结构间的Wasserstein距离差异显著,证明了生成任务的多样性。最终生成结构的平均WD仅为约2.21纳米,保真度极高。即使是包含约15000个碱基对的大型结构,模型也能实现高保真生成。

进一步的RMSD分析证实,大多数生成结构与训练样本存在明显差异,这表明模型确实学到了普适性的生成规律,而非进行机械记忆。

图2:扩散模型生成过程与结构保真度分析。

设计空间的革命性扩展

Generative SNUPI的强大之处,在于它释放了前所未有的设计自由度。研究展示了大量传统方法难以实现的复杂设计案例,包括艺术图案、剪纸超材料、三维曲面线框结构以及复杂的结状拓扑结构。

与依赖规则晶格的传统方法不同,该系统能够轻松生成弯曲边缘、倾斜连接点及高度不规则的几何体。过去,这类自由形态的结构设计需要专家投入大量时间与经验,而现在,生成式AI可以自动完成。

图3:复杂自由形态DNA折纸设计展示。

实验验证:从蓝图到实物

任何纳米设计的终极检验在于实验验证。研究人员选取了多个生成设计进行原子力显微镜(AFM)和凝胶电泳实验。

一个典型案例是两个“狗脸”结构的迭代设计。第一个版本(Face 1)因局部连接不足,模拟预测其柔性过高、波动较大。AFM结果确实显示该区域出现塌陷和图像模糊。研究人员随后增加了边缘连接,生成了Face 2。改进后的设计显著降低了结构偏差,AFM图像与目标轮廓高度吻合。

此外,从蒙娜丽莎、历史人物雕像到地标建筑、公司Logo启发的一系列复杂图案,大多数都能正确折叠,且单体产率超过80%。其中部分结构,如六角手性结构和旋转三角形结构,还表现出了预期的动态开合行为。

图4:AFM实验验证与结构修正过程。

迈向动态与模块化系统

研究并未局限于静态结构。团队进一步利用Generative SNUPI设计了具备机械变形能力的DNA超材料,例如具有负泊松比特性的旋转三角形和凹角结构。通过在连接点引入短单链缺口以降低局部刚性,这些结构能在外部连接器作用下实现“开合”状态转换。实验证实,这两种结构的面积可分别缩小约34.9%和47.3%。

更令人印象深刻的是模块化组装。研究人员设计了包含不同面部和身体模块的“狗”结构。由于模型能精确匹配模块接口的几何形状,不同模块得以稳定组装。实验表明,四种不同的组合均成功形成了二聚体,组装产率超过65%。

图5:DNA超材料动态变形与模块化组装。

讨论:范式转变的开端

这项研究首次系统性地证明了扩散模型在DNA折纸从头设计中的巨大潜力。与依赖固定规则和人工经验的方法相比,Generative SNUPI的根本突破在于,它能够直接学习DNA纳米结构的几何先验,从而自动化生成复杂的自由形态。

通过物理模拟破解数据瓶颈,是生成式AI能在该领域落地应用的关键。更重要的是,该系统展示的能力已超越静态造型,涵盖了可变形机械结构、剪纸超材料、模块化装配系统乃至动态纳米器件。这标志着DNA纳米技术正从“规则晶格时代”迈向“自由生成时代”。

当然,当前模型主要支持双螺旋线框结构,未来的扩展方向明确:包括更复杂的六螺旋束结构、多层晶格以及片层架构。随着更多训练数据和深度学习工具的整合,未来有望形成一个完整的“AI自动设计—物理预测—实验验证”闭环体系。

从更广阔的视角看,这项研究代表了DNA纳米技术设计范式的一次重要演进:从基于规则的计算机辅助设计,逐渐转向数据驱动的生成式设计。生成式AI未来或许将像重塑蛋白质设计领域一样,重新定义DNA纳米结构工程的边界与可能性。

参考资料

Truong-Quoc, C., Jeon, K., Kim, J. et al. De novo design of DNA origami with a generative diffusion model. Nat Commun (2026).

https://doi.org/10.1038/s41467-026-73578-z

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策