英伟达推出 Lyra2.0:一张照片生成90米级3D环境,多项指标领先同类

2026年4月16日,英伟达研究团队正式推出3D场景生成系统 Lyra2.0。这项技术旨在从一张照片出发,构建规模大、连贯性强的虚拟环境,并突破了相机长路径移动下常见的画面失真问题。在具身智能训练需求快速增长的背景下,Lyra2.0的发布被视为AI在三维空间理解与实时环境模拟上的一次重要进步。

在技术上,Lyra2.0可利用单张照片扩展出最长约90米的3D场景。针对传统视频模型因“遗忘”带来的空间扭曲和误差累积,研究人员提出两项关键改进:一是实时存储每一帧的三维几何信息,确保相机回到旧位置时场景保持一致;二是在训练中有意加入带缺陷的输出,让模型具备自我纠偏能力。基准测试结果显示,Lyra2.0在图像质量与相机控制等方面均优于 GEN3C、Yume-1.5 等多个竞争对手,其快速版本的生成效率更提升了13倍。

目前,Lyra2.0已可与 Nvidia Isaac Sim 等物理引擎无缝衔接,生成的3D场景还能直接导出为网格模型。这个闭环流程让机器人能够在纯AI生成的环境中高效完成仿真训练,大幅降低对真实世界大规模三维数据采集的依赖。尽管系统当前仍专注于静态场景,但在生成规模与稳定性方面的提升,已为自动驾驶与通用机器人(AGI)的物理感知演进提供了更具想象力的基础设施支撑。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享