开源图生图新王者!腾讯混元图像3.0官宣开源,800亿参数加持助力AI创作

 伴随“元宝春节10亿红包”活动热闹上线,腾讯混元团队在1月28日正式发布消息,开源其最新混元图像3.0图生图模型(HunyuanImage3.0-Instruct)。该模型基于混合专家架构(MoE),总参数规模达800亿(激活参数约13B),在 LMArena 全球影像编辑榜单中位居第七,稳入第一梯队,被称为目前全球最强的开源图生图模型。

QQ20260128-155750.png

核心技术亮点:“先思考,后编辑”。 混元图像3.0采用原生多模态架构,深度融合文本与视觉理解。通过千万级数据与思维链(CoT)训练,模型学会在动手前先分析图像内容和用户意图,从而生成更准确的编辑指令。结合自研 MixGRPO 算法,指令遵循更到位,并能有效保持未编辑区域的一致性。

全能编辑体验与多场景应用。 该模型支持增删改、风格切换、人物与文字调整、老照片修复、多图融合等多种玩法。对普通用户,它是制作表情包与社交分享的利器;对专业设计师,它可明显提升电商海报与游戏角色定制的创作效率。

全面拥抱开源生态。 目前,腾讯混元已将模型权重和完整代码托管至GitHubHugging Face。除了标准版,还同步推出蒸馏版,进一步降低开发者上手门槛。开发者与研究者现在即可获取这些资源,基于这一强大基础进行应用研发与二次开发。

官网体验:https://hunyuan.tencent.com/chat/HunyuanDefault?from=modelSquare&modelId=Hunyuan-Image-3.0-Instruct

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享