英伟达发布 Lyra2.0:单照生成90米3D 环境,多项指标超越竞争对手

2026-04-26阅读 405热度 405
其他

英伟达Lyra2.0发布:单图生成90米3D世界,为机器人训练造“无限副本”

就在最近,英伟达研究团队扔下了一枚“重磅冲击波”——全新的3D场景生成系统Lyra2.0正式亮相。这项技术的目标很明确:只用一张照片,就能构建出大规模、高度连贯的虚拟环境。它真正啃下了一块硬骨头:解决了在长距离相机路径下,图像容易失真、场景“崩坏”的老大难问题。眼下,具身智能的训练需求正呈指数级增长,Lyra2.0的诞生,无疑标志着AI在三维空间理解与实时环境模拟上,迈出了关键一步。

那么,它的能耐到底有多大?技术细节显示,Lyra2.0能够从单张照片出发,生成延伸范围高达90米的完整3D环境。这听起来简单,背后却要克服一个经典难题:传统的视频生成模型在“走远”后,常常会“遗忘”起点附近的细节,导致空间失真和误差不断累积,最终场景变得支离破碎。

Lyra2.0的破解之道,用上了双重创新策略。首先,系统会实时存储每一帧的3D几何信息,这就好比给虚拟世界绘制了一幅精确的“记忆地图”。当相机镜头重新回到某个旧位置时,环境能保持绝对一致,不会出现“穿帮”。更巧妙的是第二点:研究人员在训练时,特意给模型“喂”了一些带有缺陷的输出数据。这一招让模型学会了自我纠偏,能够主动识别并修复生成过程中可能出现的错误。结果如何?基准测试给出了答案:在图像质量和相机控制等多个核心维度上,Lyra2.0的表现都超越了GEN3C、Yume-1.5等六个同类系统。而且,它的快速版本,生成效率更是提升了惊人的13倍。

当然,技术突破的价值最终要落在应用上。目前,Lyra2.0已经实现了与Nvidia Isaac Sim这类物理引擎的无缝衔接。这意味着,它生成的3D场景可以直接导出为标准的网格模型,形成一个从生成到仿真的闭环流程。对于机器人研发而言,这相当于提供了一个“无限副本”的训练场——机器人可以在完全由AI生成的高保真环境中进行高效、安全的仿真训练,极大地降低了对昂贵、耗时的现实世界大规模3D数据采集的依赖。

话说回来,Lyra2.0目前仍主要专注于静态场景的生成。但即便如此,它在3D生成规模与稳定性上的巨大提升,已经为自动驾驶、通用机器人(AGI)的物理感知进化,铺设了一条更具想象力的基础设施道路。未来的智能体,或许将从这些虚拟却无比真实的“世界”中,学会理解和驾驭我们的物理宇宙。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策