伴随“元宝春节10亿红包”活动热闹上线,腾讯混元团队在1月28日正式发布消息,开源其最新的 混元图像3.0图生图模型(HunyuanImage3.0-Instruct)。该模型基于混合专家架构(MoE),总参数规模达800亿(激活参数约13B),在 LMArena 全球影像编辑榜单中位居第七,稳入第一梯队,被称为目前全球最强的开源图生图模型。

核心技术亮点:“先思考,后编辑”。 混元图像3.0采用原生多模态架构,深度融合文本与视觉理解。通过千万级数据与思维链(CoT)训练,模型学会在动手前先分析图像内容和用户意图,从而生成更准确的编辑指令。结合自研 MixGRPO 算法,指令遵循更到位,并能有效保持未编辑区域的一致性。
全能编辑体验与多场景应用。 该模型支持增删改、风格切换、人物与文字调整、老照片修复、多图融合等多种玩法。对普通用户,它是制作表情包与社交分享的利器;对专业设计师,它可明显提升电商海报与游戏角色定制的创作效率。
全面拥抱开源生态。 目前,腾讯混元已将模型权重和完整代码托管至
官网体验:https://hunyuan.tencent.com/chat/HunyuanDefault?from=modelSquare&modelId=Hunyuan-Image-3.0-Instruct
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?