腾讯发布混元世界模型1.5:实时交互虚拟世界开启

腾讯宣布上线混元世界模型 1.5(Tencent HY WorldPlay),定位为国内首个开放的实时交互体验平台。用户只需输入文字或提供图片,就能迅速生成独特的互动世界;同时可用键盘、鼠标或手柄操控虚拟相机,像玩游戏一样实时自由探索 AI 构建的场景。

image.png

混元世界模型 1.5 主要带来三项能力:其一,实时交互生成,结合自研的 Context Forcing 蒸馏与流式推理优化,可输出每秒 24 帧、720P 的高清视频;其二,具备大范围的 3D 一致性,用户离开某区域后再次返回时,模型能准确“记住”该区域的三维结构,保持场景连贯;其三,交互方式多样,覆盖不同风格的游戏与真实场景,支持多视角切换与文本实时触发事件。

此次发布还首次开源了面向实时世界模型的完整训练体系,覆盖数据、训练到推理部署全链路。技术报告披露了预训练、持续训练以及自回归视频模型的强化学习等细节。模型采用基于 Next-Frames-Prediction 的视觉自回归训练目标,打破了实时性与几何一致性之间的矛盾,为世界建模带来新的可能。

混元世界模型 1.5 不仅实现技术突破,也为 AIGC 的发展打开了更大的想象空间。未来的 AI 不再止于生成文字、图片或视频,而是能构建可被实时探索和交互的完整虚拟世界,广泛适用于游戏开发、影视制作和虚拟现实等领域。

  • 在线体验网站:https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay

  • Github链接:https://github.com/Tencent-Hunyuan/HY-WorldPlay

  • Hugging Face链接:https://huggingface.co/tencent/HY-WorldPlay

  • 项目主页:https://3d-models.hunyuan.tencent.com/world/

划重点:

🌍  文字或图片即可生成可互动的虚拟世界,并可实时自由探索。  

🎮  具备实时交互、大范围 3D 一致性与多样交互体验。  

🔧  首次开源的训练体系,为 AIGC 带来全新可能。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享