苹果推出 LiTo 大模型:一图生成 3D,光影还原提升 37%

苹果 AI 研究团队近期带来了 LiTo(表面光场标记化)3D 生成大模型。这项技术突破了 3D 重建的老难题,让一张平面图片就能生成光影真实、细节完整的 3D 对象。

image.png

LiTo 的关键在于创新地利用潜在空间(Latent Space)并提出统一的 3D 潜在表示:

  • 高效编码:将繁复的表面光场信息压缩成紧凑的向量集合,用数学方式刻画物体几何与光照交互的物理规律。

  • 双向机制:采用编码器-解码器架构。编码器提取几何结构与外观特征;解码器再向后重建,可精准还原镜面高光菲涅尔反射高级视觉效果。

性能表现:多视角光影一致性

为训练 LiTo,团队使用了涵盖数千个对象的 3D 数据集。实验结果显示:

  • 解决方向偏差:LiTo 严格遵循摄像机坐标系,修正了同类模型常见的物体朝向错误问题。

  • 指标领先:在多视角光影一致性指标上,LiTo 相比当前顶尖的 TRELLIS 模型提升约 37%

这一进展意味着 3D 内容创作门槛进一步降低,未来有望为增强现实(AR)以及空间计算设备(如 Vision Pro)提供更高质量的素材生成支持。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享