智谱宣布与华为共同开源全新一代图像生成模型

GLM-Image 支持在同一个模型内完成文本到图像与图像到图像的双向生成。
- 文本转图像:依据文字描述输出高细节画面,尤其在信息量大的场景中表现更稳更准。
- 图像到图像:覆盖多种能力,包括图像编辑、风格迁移、多主体一致性,以及人物/物体身份保留生成等。
在技术指标方面,
目前,


-
GitHub:https://github.com/zai-org/GLM-Image
-
Hugging Face:https://huggingface.co/zai-org/GLM-Image
划重点:
-
🇨🇳 国产全栈自研:依托华为昇腾 Atlas800T A2 设备与昇思 MindSpore 框架完成端到端训练,实证国产算力打造顶尖模型的可行路径。
-
🎨 文图融合突破:混合架构发力,在 LongText-Bench 等长文本渲染评测中位居开源阵营第一,显著提升汉字与复杂图文的生成准确度。
-
💰 高性价比开源:原生多分辨率自适应生成,API 定价亲民,对创作者与企业友好,助推国产认知型生成技术普及落地。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?