智谱正式宣布与华为共同开源新一代图像生成模型

GLM-Image 可在同一模型中同时完成文本到图像与图像到图像两类生成任务。
- 文本转图像: 基于文字描述生成高细节图片,在信息量大的场景下表现尤为亮眼。
- 图像到图像: 覆盖图像编辑、风格迁移、多主体一致性,以及人物与物体的身份保留等多种能力。
在技术表现方面,
目前,


-
GitHub:https://github.com/zai-org/GLM-Image
-
Hugging Face:https://huggingface.co/zai-org/GLM-Image
划重点:
-
🇨🇳 国产全栈自研: 基于华为昇腾 Atlas800T A2 设备与昇思 MindSpore 框架完成端到端训练,验证了用国产算力打造一流模型的可行性。
-
🎨 文图融合突破: 采用混合架构,在 LongText-Bench 等长文本渲染榜单中取得开源榜首,显著提升汉字与复杂图文的生成准确度。
-
💰 高性价比开源: 模型原生支持多分辨率自适配生成,并以极低的 API 价格向创作者开放,助力国产认知型生成技术普及。


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?