让图像编辑进入“会思考”的新阶段:腾讯推出混元图像3.0图生图模型

腾讯混元宣布推出混元图像3.0图生图(HunyuanImage3.0-Instruct)模型。该模型已在腾讯旗下 AI 助手“元宝”全平台以及腾讯混元官网同步开放,意味着腾讯在原生多模态图像处理方面再下一城。

混元图像3.0图生图基于主流的混合专家(MoE)架构,整体参数规模达到80B(激活约13B)。与传统滤镜式美化不同,它定位为一款“能思考”的图像编辑模型。接收用户提示词与图片后,模型会先深入理解画面,再自动推理出需调整的区域与步骤,并准确保留不需更改的细节,输出更符合逻辑的结果。

image.png

在功能层面,这一模型展现出极高的灵活性。不仅支持常见的元素增删、风格替换与老照片修复,还拥有强大的多图融合能力,可将多张图片中的人物或元素抽取并合成。对普通用户来说,这意味着可以直接在元宝上快速做个性化表情包、虚拟合拍,甚至完成专业级的电商海报与游戏角色定制。

为打造这一模型,混元团队搭建了千万级图生图数据集,覆盖80+细分任务。通过引入思维链训练与自研的 MixGRPO 算法,模型在指令响应速度与图像一致性方面均显著提升。无论是情绪表现力还是生成的真实感,混元图像3.0图生图都为 AI 图像创作带来更专业、更易上手的工具选项。

重点看这里:

  • 🧠 自我推理式编辑:混元图像3.0图生图会先读懂原图再按指令操作,自动识别需改动的区域,同时保持未编辑部分的一致性。

  • 🎨 多场景全面覆盖:支持老照片修复、人物合成与复杂文字修改,广泛适用于电商海报、游戏定制等创意场景。

  • 性能与效率齐提升:依托80B MoE 架构与千万级数据集训练,生成的图像情绪表现更饱满,生成速度较上一代明显加快。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享