腾讯发布混元图像3.0图生图模型:语义理解加持,“一句话”即可精准修图

1月26日,腾讯混元宣布推出其全新的**混元图像3.0图生图(HunyuanImage3.0-Instruct)**模型。该模型补齐混元在图像编辑与多图融合上的关键能力,目前已在腾讯元宝全端与官网同步开放。

QQ20260126-150904.png

80B 参数旗舰:能理解、会推理的图像编辑

混元图像3.0图生图模型总参数达80B(激活参数约13B),采用先进的混合专家(MoE)架构。不同于传统修图工具,它具备出色的语义理解与推理能力:接收到图片与提示词后,会先解析画面内容并拆分编辑步骤,精准识别需要调整与保留的区域。

依托千万级图生图数据与自研 MixGRPO 算法,模型在非编辑区域的一致性、指令响应速度以及画面真实感方面均有明显提升。

QQ20260126-150913.png

QQ20260126-150920.png

多场景适配:从老照片修复到多图合成合照

该模型覆盖80余种细分任务,为用户提供丰富的创作能力:

  • 图片精修: 支持对光线、肤质与背景进行增删改,甚至可在不破坏排版的前提下修改图中文字。

  • 风格变换: 实现真人转漫画、像素风格转换或老照片复原。

  • 深度融合: 可提取多张照片中的人物或元素,快速合成全新的合照或创意画面。

目前,用户可通过腾讯元宝体验 AI 制作表情包、虚拟合拍与电商海报设计等功能。这意味着大模型 P 图正式迈入“意图驱动”的高效时代。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享