近日,美团 LongCat 团队发布并开源了全新的图像生成模型 LongCat-Image。该模型以 6B 参数体量兼顾高性能与易上手,面向日益增长的 AI 作图需求。随着行业对生成式图像的关注持续升温,LongCat-Image 及时推出,进一步缩小开源与闭源模型之间的差距。

LongCat-Image 在文生图与图像编辑任务上表现亮眼。尤其是编辑能力,模型在多项基准中取得开源 SOTA(State-of-the-Art)成绩,充分展现出优秀的指令遵循与视觉一致性。团队通过系统化的训练流程与数据工程,让模型在各种指令下依旧保持高效与准确。
在中文文字生成方面,LongCat-Image 的精准度极高。模型采用课程式训练策略,全面提升汉字的字符覆盖与渲染效果,能够稳定处理笔画复杂的汉字,满足海报设计、商业广告等应用场景。

另外,LongCat-Image 的设计非常重视用户体验,团队采用主观评分方法评估模型,确保在文生图与图像编辑任务上的真实感与视觉合理性达到高标准。基于这些努力,LongCat-Image 在与其他开源与闭源模型的竞品对比中脱颖而出,展现出不俗的市场潜力。
LongCat 团队表示,希望通过开源构建一个透明、开放、协作的生态,鼓励开发者积极参与模型的使用与共建。用户可通过 Hugging Face 和 GitHub 获取 LongCat-Image,体验这一高效能模型的强大功能。
为进一步拓展 AI 创作可能性,LongCat APP 也同步升级,新增图生图功能。用户可轻松上传各类素材,模型将自动生成全新图像;同时,APP 提供 24 个易用模板,帮助用户快速产出专业级作品。
地址: https://longcat.ai/


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?