2026年2月10日,阿里云发布新一代图像生成基础模型 Qwen-Image-2.0。这一版本代表通义千问在图像方向的重大跃迁,把“图像生成”和“图像编辑”两条路线汇成一体,并在多项盲评基准中交出亮眼成绩。

核心技术亮点
Qwen-Image-2.0 采用 7B 轻量架构,在保持推理高速的同时,带来四项关键优势:
-
专业级文字渲染(“准”“多”): 支持最长约 1k token 的复杂指令。无论是复杂的 PPT 页面、专业信息图(如 A/B 测试报告、OKR 方法图解),还是中英双语海报,均可实现像素级精细排版与多介质渲染。
-
顶级的真实质感(“真”): 原生支持 2K 分辨率(2048×2048),细腻呈现皮肤毛孔、织物纹理和建筑细节,在电影海报等写实场景表现尤为出色。
-
生图编辑一体化能力: 作为一个 Omni(全能)模型,理解与生成深度融合。用户可直接在已有图片上进行书法题字、跨次元内容添加或多图自然合成,无需切换模型管线。
-
审美与对齐(“美”“齐”): 模型具备超高的排版审美,可自动在画面留白处布置文字(如宋词水墨画),并确保多格漫画或复杂表格中的文本整齐对齐。

典型使用场景
从赵孟頫的行楷、宋徽宗的瘦金体到王羲之的小楷,《兰亭集序》等长篇书法作品都能被准确渲染。
同时,Qwen-Image-2.0 可处理逻辑复杂的 4×6 漫画生成,保证角色的一致性与对话框的自然对齐。
目前,Qwen-Image-2.0 已在阿里云百炼平台开启 API 邀测,开发者与用户也可通过
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?