腾讯推混元世界模型 1.5,实时互动虚拟世界开启

腾讯发布混元世界模型 1.5(Tencent HY WorldPlay),号称国内首个对外开放的实时交互体验平台。只需输入简短文字或上传图片,模型就能迅速搭建独特的可互动世界;用户可用键盘、鼠标或手柄操控虚拟相机,像玩游戏一样实时漫游 AI 生成的场景。

image.png

混元世界模型 1.5 的三项核心能力:首先是实时交互生成,结合原创的 Context Forcing 蒸馏方案与流式推理优化,可在每秒 24 帧生成 720P 高清视频;其次具备长程 3D 一致性,用户离开区域后再回到同处,模型仍能精准“记住”该处三维结构,保证画面连贯;最后提供多样化交互体验,适配不同风格玩法与真实场景,并支持多视角切换与实时文本触发事件。

此次版本还首次开源了业内覆盖最全的实时世界模型训练体系,涵盖数据、训练到推理部署的完整链路。腾讯混元团队在技术报告中详述了预训练、持续训练以及自回归视频模型的强化学习等细节。模型采用 Next-Frames-Prediction 视觉自回归任务,在实时性与几何一致性之间取得新平衡,为世界建模带来更多可能。

混元世界模型 1.5 不仅技术上取得突破,也为 AIGC 的未来拓展了想象空间。未来的 AI 不再只生成文本、图片或视频,而是能创建可实时探索、可互动的完整虚拟世界。这一模式在游戏开发、影视制作与虚拟现实等领域前景广阔。

  • 在线体验地址:https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay

  • GitHub 链接:https://github.com/Tencent-Hunyuan/HY-WorldPlay

  • Hugging Face 链接:https://huggingface.co/tencent/HY-WorldPlay

  • 项目主页:https://3d-models.hunyuan.tencent.com/world/

划重点:

🌍 腾讯混元世界模型 1.5 可用文字或图片快速生成可互动虚拟世界,并支持实时探索。

🎮 具备实时交互、长程 3D 一致性与丰富的交互体验。

🔧 首次开源的训练体系为 AIGC 发展带来新的可能。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享