2026年4月16日,英伟达研究团队正式推出3D场景生成系统 Lyra2.0。这项技术旨在从一张照片出发,构建规模大、连贯性强的虚拟环境,并突破了相机长路径移动下常见的画面失真问题。在具身智能训练需求快速增长的背景下,Lyra2.0的发布被视为AI在三维空间理解与实时环境模拟上的一次重要进步。
在技术上,Lyra2.0可利用单张照片扩展出最长约90米的3D场景。针对传统视频模型因“遗忘”带来的空间扭曲和误差累积,研究人员提出两项关键改进:一是实时存储每一帧的三维几何信息,确保相机回到旧位置时场景保持一致;二是在训练中有意加入带缺陷的输出,让模型具备自我纠偏能力。基准测试结果显示,Lyra2.0在图像质量与相机控制等方面均优于 GEN3C、Yume-1.5 等多个竞争对手,其快速版本的生成效率更提升了13倍。
目前,Lyra2.0已可与 Nvidia Isaac Sim 等物理引擎无缝衔接,生成的3D场景还能直接导出为网格模型。这个闭环流程让机器人能够在纯AI生成的环境中高效完成仿真训练,大幅降低对真实世界大规模三维数据采集的依赖。尽管系统当前仍专注于静态场景,但在生成规模与稳定性方面的提升,已为自动驾驶与通用机器人(AGI)的物理感知演进提供了更具想象力的基础设施支撑。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?