腾讯混元团队今日宣布,“混元3D 世界模型2.0”(HY-World2.0)正式发布并开源。作为多模态世界模型的一次重要升级,新版能力从只会生成视频,跨越到可产出“可交互、可编辑的3D 资产”。它支持文本、图片、视频等多种输入,可自动生成、重建并模拟包含人物、物体与场景的完整3D 空间;同时可导出 Mesh、3DGS 与点云等多种格式,并可与 Unity、UE 等主流游戏引擎工作流顺畅衔接。

在技术架构上,HY-World2.0 将空间理解、生成与重建统一为一体化流程。核心升级包括:基于端到端隐式学习的 HY-Pano-2.0,可在不依赖相机参数的情况下实现 360° 全景映射;自研的空间 Agent 结合 VLM 与 navmesh 表达,让系统具备智能规划漫游路线的能力;同时引入 WorldStereo 机制,确保新生成区域与既有场景在几何与视觉层面的高度一致。


另外,升级至 WorldMirror2.0 的架构能够复刻真实场景,可一次性预测密集点云与相机位姿,实现高精度的数字孪生构建。
与谷歌 Genie3 等主流模型相比,混元 2.0 的突破在于生成的资产具备真实的物理碰撞属性,并支持角色模式自由探索,显著降低了游戏关卡原型制作与具身智能仿真环境搭建的门槛。
这次发布意味着腾讯混元在 3D 生成领域从“做物体”迈向“造世界”,依托 SOTA 级的空间一致性记忆机制,把 AI 驱动的 3D 内容创作推向实用落地阶段。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?