阿里云开源通义千问图像编辑模型 Qwen-Image-Edit-2511:修复“图像漂移”,编辑更稳更准

阿里云持续加码AIGC开源生态。今天,通义实验室正式开放其最新图像编辑模型——Qwen-Image-Edit-2511,重点修复前代版本(2509)在编辑后出现的“轻微漂移”问题(即被编辑区域的人物或物体位置发生偏差)。通过多项技术升级,显著增强编辑前后的对齐与视觉稳定性,为开发者带来更可靠、精准的可控生成工具。

直面痛点:不再“越改越偏”的编辑体验

在早期版本 Qwen-Image-Edit- 2509 中,用户反馈在进行局部调整(如更换服装、改发型、换背景)时,目标对象会出现细微但明显的位移或形变,影响画面协调。Qwen-Image-Edit- 2511 有针对性地强化空间对齐与结构保持能力,确保修改只作用于指定区域,其他部分保持原样,实现“所见即所得”的精确控制。

技术升级:以一致性为核心,兼顾生成效果

新版本在以下方面实现关键增强:  

– 结构一致性优化:引入改进版参考注意力机制,进一步约束原始图像的几何结构;  

– 细节保真度提升:像素级修复时保留纹理、光照与边缘清晰度;  

– 指令-图像对齐增强:更准确理解复杂编辑需求(如“为女士添加红色贝雷帽,帽子位置自然贴合”)。

开源赋能,推进AIGC工具链走向成熟

Qwen-Image-Edit- 2511 已开放模型权重与推理代码,支持文本指令与掩码图编辑,适用于电商换装、影视后期、设计原型迭代、社交媒体修图等场景。开发者可在此基础上快速搭建高精度图像编辑应用,无需从零开始训练。

业内观点认为,图像编辑模型的“微米级”精度进步,是AIGC从“能用”到“好用”的关键一步。当AI不再“手抖”,创作者才能放心把它当作可靠的数字画笔。此次阿里云快速迭代并开源修复版,既体现了技术响应速度,也展现了国内大模型厂商在垂直能力深耕与社区共建上的持续投入——AIGC的下一程,属于那些能解决真实世界“小问题”的大模型。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享