图像编辑迈入“思考”阶段:腾讯发布混元图像 3.0 图生图模型

腾讯混元官宣推出混元图像3.0图生图(HunyuanImage3.0-Instruct)模型。该模型已在腾讯旗下的 AI 助手“元宝”全端与腾讯混元官网同步上线,意味着腾讯在原生多模态图像处理上又迈出一步。

混元图像3.0图生图采用主流的混合专家(MoE)架构,总参数量80B(激活约13B)。不同于传统的滤镜式修图,它被定位为一款“会思考”的图像编辑模型。模型接收用户的提示词与图片后,会先深入理解画面,再自主推断需要调整的区域与步骤,并精准保留无需改动的细节,输出更符合逻辑的效果。

image.png

在功能上,该模型展现出极高的灵活度。它不仅支持元素的增删、风格切换、老照片修复,还具备强大的多图融合能力,能把多张照片中的人物或元素提取并合成。对普通用户来说,可直接在元宝上快速制作个性化表情包、虚拟合拍,甚至完成电商海报设计和游戏角色定制。

为打磨这款模型,混元团队构建了千万级图生图数据集,覆盖超过80个细分任务。通过引入思维链训练与自研的 MixGRPO 算法,模型在指令响应速度和图像一致性上都有明显提升。无论是情绪表现还是真实感,混元图像3.0图生图都为 AI 图像创作提供了更专业、更易上手的选择。

划重点:

  • 🧠 自主推理编辑:混元图像3.0图生图会先理解原图再按指令操作,自动识别需改动的区域,并保持非编辑区的一致性。

  • 🎨 多场景功能覆盖:支持老照片修复、人物合影合成及复杂文字替换,可广泛应用于电商海报、游戏定制等创意领域。

  • 性能与效率双提升:基于80B MoE 架构及千万级数据集训练,生成的图像情绪张力更强,且生成速度较前代更快。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享