全球顶尖开源生图 AI 亮相,Ideogram 4.0 靠“排版绝活”惊艳全场

人工智能创业公司 Ideogram 近期正式推出了备受关注的 Ideogram 4.0 开放权重文生图模型。结合权威榜单评分数据和多项视觉评测结果来看,这款模型目前已经被行业普遍视为全球表现非常突出的开源图像生成 AI。它的核心参数规模达到 9.3B(93 亿),并采用了当下先进开源模型常见的单流架构方案,让文本与图像标记(tokens)能够在同一自注意力序列中顺畅融合。

image.png

排版够稳,才算真正的海报高手

从技术结构来看,Ideogram 4.0 融合了先进的 Qwen3-VL-8B-Instruct 文本编码器、34 层单流扩散 Transformer(DiT),以及 Euler 流匹配采样器。这套深入优化后的架构设计,让模型在图片中准确绘制长文本方面表现得非常出色。相比以往生图模型经常出现字母混乱、拼写出错等问题,这一新模型能够生成更加清晰、准确的文字内容,非常适合用于视觉排版、封面制作和文字海报设计。

为了让画面里的元素分布更加协调,研发团队在训练阶段加入了对象与文本的边界框数据。同时,再结合结构化的 JSON 字幕数据进行训练,Ideogram 4.0 表现出了对空间关系很强的理解能力。现在,用户只需要通过提示词,就能更精准地控制整体画面布局、各类对象的位置以及文字排版方式,基本摆脱了过去生图像“抽卡”一样不稳定的情况。

image.png

盲测榜单中拿下全球第四

从官方公布的案例来看,Ideogram 4.0 生成的图像质量非常出色,无论是复杂人物、细致场景,还是各类商业设计内容,它都能够较好应对,为图片创作和社交媒体素材生成提供了很大帮助。在知名图形评测平台 DesignArena 的最新榜单中,Ideogram 4.0 的成绩甚至超过了 Nano Banana Pro,直接冲到了全球第四名。

另外需要说明的是,这份榜单采用的是完全隐藏模型名称的方式,由人工评审仅根据最终视觉效果进行盲测评分。这种基于真实观感的人工评估方式具有很强的参考价值和可信度,也进一步说明了 Ideogram 4.0 在开源生图领域里的领先表现。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享