腾讯开源混元3D 世界模型2.0:一键生成可编辑的3D 空间资产

腾讯混元团队今日宣布,“混元3D 世界模型2.0”(HY-World2.0)正式发布并开源。作为多模态世界模型的一次重要升级,新版能力从只会生成视频,跨越到可产出“可交互、可编辑的3D 资产”。它支持文本、图片、视频等多种输入,可自动生成、重建并模拟包含人物、物体与场景的完整3D 空间;同时可导出 Mesh、3DGS 与点云等多种格式,并可与 Unity、UE 等主流游戏引擎工作流顺畅衔接。

QQ20260416-103610.jpg

在技术架构上,HY-World2.0 将空间理解、生成与重建统一为一体化流程。核心升级包括:基于端到端隐式学习的 HY-Pano-2.0,可在不依赖相机参数的情况下实现 360° 全景映射;自研的空间 Agent 结合 VLM 与 navmesh 表达,让系统具备智能规划漫游路线的能力;同时引入 WorldStereo 机制,确保新生成区域与既有场景在几何与视觉层面的高度一致。

QQ20260416-103545.jpg

QQ20260416-103558.jpg

另外,升级至 WorldMirror2.0 的架构能够复刻真实场景,可一次性预测密集点云与相机位姿,实现高精度的数字孪生构建。

与谷歌 Genie3 等主流模型相比,混元 2.0 的突破在于生成的资产具备真实的物理碰撞属性,并支持角色模式自由探索,显著降低了游戏关卡原型制作与具身智能仿真环境搭建的门槛。

这次发布意味着腾讯混元在 3D 生成领域从“做物体”迈向“造世界”,依托 SOTA 级的空间一致性记忆机制,把 AI 驱动的 3D 内容创作推向实用落地阶段。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享