英伟达发布 Lyra2.0:单照生成90米3D 环境，多项指标超越竞争对手

2026-04-26阅读 405热度 405

其他

英伟达Lyra2.0发布：单图生成90米3D世界，为机器人训练造“无限副本”

就在最近，英伟达研究团队扔下了一枚“重磅冲击波”——全新的3D场景生成系统Lyra2.0正式亮相。这项技术的目标很明确：只用一张照片，就能构建出大规模、高度连贯的虚拟环境。它真正啃下了一块硬骨头：解决了在长距离相机路径下，图像容易失真、场景“崩坏”的老大难问题。眼下，具身智能的训练需求正呈指数级增长，Lyra2.0的诞生，无疑标志着AI在三维空间理解与实时环境模拟上，迈出了关键一步。

那么，它的能耐到底有多大？技术细节显示，Lyra2.0能够从单张照片出发，生成延伸范围高达90米的完整3D环境。这听起来简单，背后却要克服一个经典难题：传统的视频生成模型在“走远”后，常常会“遗忘”起点附近的细节，导致空间失真和误差不断累积，最终场景变得支离破碎。

Lyra2.0的破解之道，用上了双重创新策略。首先，系统会实时存储每一帧的3D几何信息，这就好比给虚拟世界绘制了一幅精确的“记忆地图”。当相机镜头重新回到某个旧位置时，环境能保持绝对一致，不会出现“穿帮”。更巧妙的是第二点：研究人员在训练时，特意给模型“喂”了一些带有缺陷的输出数据。这一招让模型学会了自我纠偏，能够主动识别并修复生成过程中可能出现的错误。结果如何？基准测试给出了答案：在图像质量和相机控制等多个核心维度上，Lyra2.0的表现都超越了GEN3C、Yume-1.5等六个同类系统。而且，它的快速版本，生成效率更是提升了惊人的13倍。

当然，技术突破的价值最终要落在应用上。目前，Lyra2.0已经实现了与Nvidia Isaac Sim这类物理引擎的无缝衔接。这意味着，它生成的3D场景可以直接导出为标准的网格模型，形成一个从生成到仿真的闭环流程。对于机器人研发而言，这相当于提供了一个“无限副本”的训练场——机器人可以在完全由AI生成的高保真环境中进行高效、安全的仿真训练，极大地降低了对昂贵、耗时的现实世界大规模3D数据采集的依赖。

话说回来，Lyra2.0目前仍主要专注于静态场景的生成。但即便如此，它在3D生成规模与稳定性上的巨大提升，已经为自动驾驶、通用机器人（AGI）的物理感知进化，铺设了一条更具想象力的基础设施道路。未来的智能体，或许将从这些虚拟却无比真实的“世界”中，学会理解和驾驭我们的物理宇宙。

英伟达发布 Lyra2.0:单照生成90米3D 环境，多项指标超越竞争对手

英伟达Lyra2.0发布：单图生成90米3D世界，为机器人训练造“无限副本”

相关阅读

最新教程

最新资讯