阿里通义发布 Z-Image:上线当天下载量破 50 万

阿里通义官宣推出其全新的文生图模型 Z-Image。上线首日即快速登上 Hugging Face 趋势榜,下载量达到 50 万次。Z-Image 仅有 6 亿参数,却能带来接近大模型的照片级真实感,细腻还原皮肤纹理、发丝细节与自然光影和材质质感,在构图与氛围上也有不错的美学表现。

image.png

Z-Image 同步上线了加速版 Z-Image-Turbo,生成高质量图片时只需 8 步推理,特别适合日常创作、海报设计与快速原型制作。即使在复杂的文字排版场景下,Z-Image-Turbo 也能稳定渲染中英文混排,文字清晰可读,同时兼顾人脸真实感和整体画面美感。

该模型具备广泛的现实世界知识,能够生成知名地标如埃菲尔铁塔与故宫,并在细节、比例与语境上与真实世界相契合。配合提示词增强器,Z-Image 可以理解并处理复杂任务,不只是“会画”,更能在理解之后进行创作。

此外,Z-Image-Edit 专注于复杂复合编辑指令的执行,例如“让人物微笑 + 转头 + 背景换成樱花 + 添加中文标语”,在大幅修改时依然保持光照、身份与风格的高度一致,尽量避免错位和失真。

在数据层面,Z-Image 构建了高效的数据生态,强调用“对的数据”提升训练效率。模型架构采用单流扩散 Transformer(S3-DiT),有效提高参数利用率。训练过程中通过三阶段渐进式策略系统注入世界知识,并借助 Z-Image-Turbo 实现实时的高质量生成。

  • GitHub:https://github.com/Tongyi-MAI/Z-Image

  • Hugging Face:https://huggingface.co/Tongyi-MAI/Z-Image-Turbo

划重点:  

🌟 上线当天下载量达 50 万,迅速登顶 Hugging Face 趋势榜。  

🎨 6 亿参数即可实现照片级真实感,同时支持稳定的文本渲染。  

🚀 Z-Image-Turbo 与 Z-Image-Edit 带来高效生成与强大编辑能力。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享