蚂蚁集团开源 Ring-2.5-1T:全球首个混合线性架构万亿参数思考模型发布

2月13日,蚂蚁集团开源发布全球首个采用混合线性架构的万亿参数思考模型 Ring-2.5-1T,在长文本生成、数学推理与智能体任务执行方面达到开源领先,为智能体(Agent)时代的复杂任务处理提供高性能底座。

在生成效率上,Ring-2.5-1T 在 32K 以上长文本生成场景中,相比上代模型访存规模降低 10 倍以上,生成吞吐提升 3 倍以上。深度思考能力方面,该模型在国际数学奥林匹克(IMO2025)和中国数学奥林匹克(CMO2025)自测均达金牌水平(IMO 35 分、CMO 105 分)。同时,模型可轻松适配 Claude Code 等智能体框架与 OpenClaw 个人 AI 助理,支持多步规划与工具调用。

6dbe46ff4e7ff7c865ef8f9b6c8fe934.png

(图说:Ring-2.5-1T 在数学、代码、逻辑等高难推理,以及智能体搜索、软件工程、工具调用等长程任务上,表现达到开源领先)

在多项权威基准测试中,Ring-2.5-1T 与 DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking、GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking 等主流开源与闭源模型进行了系统比测;在数学推理、代码生成、逻辑推理和智能体任务执行等高难场景中达到开源阵营领先。尤其在深度思考(Heavy Thinking)模式下,该模型在 IMOAnswerBench、HMMT-25 等数学竞赛推理基准和 LiveCodeBench-v6 代码生成基准中均超越所有对比模型,展现出强大的复杂推理与跨任务泛化能力。

Ring-2.5-1T 基于 Ling2.5 架构,通过优化注意力机制,显著提升长文本推理的效率与稳定性。模型激活参数规模由前代的 51B 提升至 63B,但在混合线性注意力架构的加持下,推理效率相较上一代仍有大幅提升。与仅具备 32B 激活参数的 KIMI K2 架构相比,在 1T 总参数量下,Ling2.5 架构在长序列推理任务中的吞吐优势依然明显,且随着生成长度增加,效率优势持续扩大。

e47b5f6931694954c794234da619fab8.png

(图说:不同生成长度下的效率对比示意。序列越长,吞吐优势越明显)

随着大模型应用从短对话拓展到长文档处理、跨文件代码理解与复杂任务规划,Ring-2.5-1T 有效缓解了长输出场景下计算开销高、推理速度慢的痛点。此次开源也体现了蚂蚁百灵团队在大规模训练基础设施、算法优化与工程落地上的综合实力,为行业提供了高性能、高效率的智能体时代基础模型新选择。

目前,Ring-2.5-1T 的模型权重与推理代码已在 Hugging Face、ModelScope 等主流开源平台发布。官方平台 Chat 体验页与 API 服务将在近期上线。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享