今日,美团 LongCat 团队官宣开源发布了最新AI 模型——LongCat-Flash-Thinking-2601。作为 LongCat-Flash-Thinking 系列的迭代版本,该模型在智能体搜索、工具调用与推理等关键评测上,已达成开源领域的最高水准(SOTA)。

LongCat-Flash-Thinking-2601 的核心优势是出色的工具调用能力。在处理依赖外部工具的复杂任务时,模型表现稳定且高效,能明显降低真实业务场景中适配新工具的训练成本。此外,该模型的“重思考模式”首次以开源方式提供免费在线体验,用户可在 https://longcat.ai 进行尝试。该模式模拟人类的深思过程,将思考拆分为并行思考与总结归纳两个阶段,保证思路更全、结论更稳。
在多轮评测中,LongCat-Flash-Thinking-2601 在编程、数学推理、智能体工具调用与搜索等维度均有亮眼表现。编程方面,模型在 LCB 评测中拿到 82.8 分,位居同类开源模型前列;数学推理方面,在 AIME-25 评测中取得满分 100 分,进一步巩固了其领先位置。

为检验泛化能力,LongCat 团队提出了全新的评测思路:借助自动化任务合成流程,支持基于关键词随机生成复杂任务,并对模型在此场景中的表现进行评估。结果显示,LongCat-Flash-Thinking-2601 在多类随机生成任务中保持领先,体现出强劲的泛化实力。
在训练策略上,团队采用“环境扩展 + 多环境强化学习”的方案,为模型构建多样且高强度的训练环境,显著提升其对复杂场景的适应性。同时对训练数据进行噪声注入,增强稳健性,使模型在遇到 API 调用失败或数据缺失等情况时依然能够高效完成任务。
为降低上手门槛,美团 LongCat 团队同步开放了模型权重、推理代码及在线体验,欢迎开发者参与共建。相关资源可在 GitHub、Hugging Face 与 ModelScope 等平台获取,并可前往 https://longcat.ai 在线体验。


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?