苹果 AI 研究团队近期带来了 LiTo(表面光场标记化)3D 生成大模型。这项技术突破了 3D 重建的老难题,让一张平面图片就能生成光影真实、细节完整的 3D 对象。

LiTo 的关键在于创新地利用潜在空间(Latent Space)并提出统一的 3D 潜在表示:
-
高效编码:将繁复的表面光场信息压缩成紧凑的向量集合,用数学方式刻画物体几何与光照交互的物理规律。
-
双向机制:采用编码器-解码器架构。编码器提取几何结构与外观特征;解码器再向后重建,可精准还原镜面高光和菲涅尔反射等高级视觉效果。
性能表现:多视角光影一致性
为训练 LiTo,团队使用了涵盖数千个对象的 3D 数据集。实验结果显示:
-
解决方向偏差:LiTo 严格遵循摄像机坐标系,修正了同类模型常见的物体朝向错误问题。
-
指标领先:在多视角光影一致性指标上,LiTo 相比当前顶尖的 TRELLIS 模型提升约 37%。
这一进展意味着 3D 内容创作门槛进一步降低,未来有望为增强现实(AR)以及空间计算设备(如 Vision Pro)提供更高质量的素材生成支持。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?