今天,美团 LongCat 团队正式推出并开源了最新的 AI 模型 ——LongCat-Flash-Thinking-2601。作为 LongCat-Flash-Thinking 系列的迭代升级版,该模型在智能体搜索、工具调用与推理等核心基准上,已达到当前开源模型的最高水平(SOTA)。

LongCat-Flash-Thinking-2601 的最大亮点是强劲的工具调用能力。这让模型在处理依赖工具的复杂任务时发挥稳定,且能大幅降低真实场景下新工具适配的训练成本。同时,模型的“重思考模式”首次以开源方式开放在线免费体验,大家可前往 https://longcat.ai 直接尝试。该模式模拟人类深思流程,将思考分为并行思考与总结归纳两步,保证思路更全面、决策更可靠。
在严格评估后,LongCat-Flash-Thinking-2601 在编程、数学推理、智能体工具调用与搜索等指标上表现亮眼。编程方面,在 LCB 测评中取得 82.8 分,位居同类模型前列;数学推理方面,在 AIME-25 测评中拿到满分 100 分,进一步巩固其在该领域的领先地位。

为检验模型的泛化能力,LongCat 团队提出了全新的评测方案:基于自动化任务合成流程,支持用户按关键词随机生成复杂任务,并评估模型在这些场景中的表现。实验显示,LongCat-Flash-Thinking-2601 在多项随机生成任务上持续领先,进一步证明其强大的泛化能力。
训练阶段,LongCat 团队采用“环境扩展 + 多环境强化学习”的策略,为模型构建多样且高强度的训练环境,显著提升其在复杂情境下的适应性。同时,团队在训练数据中加入噪声,以增强模型的稳健性,使其在遇到 API 调用失败或数据缺失等复杂情况时,仍能高效完成任务。
为降低开发者上手门槛,美团 LongCat 团队同步开放了模型权重、推理代码与在线体验,欢迎社区积极参与这一开源项目。开发者可在 GitHub、Hugging Face 与 ModelScope 等平台获取资源,并可前往 https://longcat.ai 进行在线体验。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?