美团开源 6B 级图像生成模型 LongCat-Image,中文文字生成与图像编辑双双达SOTA

近日,美团 LongCat 团队发布并开源了全新的图像生成模型 LongCat-Image。该模型以 6B 参数体量兼顾高性能与易上手,面向日益增长的 AI 作图需求。随着行业对生成式图像的关注持续升温,LongCat-Image 及时推出,进一步缩小开源与闭源模型之间的差距。

QQ20251208-101231.png

LongCat-Image 在文生图与图像编辑任务上表现亮眼。尤其是编辑能力,模型在多项基准中取得开源 SOTA(State-of-the-Art)成绩,充分展现出优秀的指令遵循与视觉一致性。团队通过系统化的训练流程与数据工程,让模型在各种指令下依旧保持高效与准确。

在中文文字生成方面,LongCat-Image 的精准度极高。模型采用课程式训练策略,全面提升汉字的字符覆盖与渲染效果,能够稳定处理笔画复杂的汉字,满足海报设计、商业广告等应用场景。

QQ20251208-101339.png

另外,LongCat-Image 的设计非常重视用户体验,团队采用主观评分方法评估模型,确保在文生图与图像编辑任务上的真实感与视觉合理性达到高标准。基于这些努力,LongCat-Image 在与其他开源与闭源模型的竞品对比中脱颖而出,展现出不俗的市场潜力。

LongCat 团队表示,希望通过开源构建一个透明、开放、协作的生态,鼓励开发者积极参与模型的使用与共建。用户可通过 Hugging Face 和 GitHub 获取 LongCat-Image,体验这一高效能模型的强大功能。

为进一步拓展 AI 创作可能性,LongCat APP 也同步升级,新增图生图功能。用户可轻松上传各类素材,模型将自动生成全新图像;同时,APP 提供 24 个易用模板,帮助用户快速产出专业级作品。

地址: https://longcat.ai/

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享