最近,字节跳动旗下的 Seed AI 团队推出了数学推理模型 Seed Prover1.5。该模型在国际数学奥林匹克(IMO)中发挥出色,成功斩获金牌,意味着人工智能在数学领域又迈出关键一步。
Seed Prover1.5 基于 Scaling Law 的训练思路,在 16.5 小时内解出 IMO2025 的前五道题,仅有一题未攻克,最终以 35 分达到金牌线。这一表现与谷歌 Gemini 不相上下。相比之下,字节此前的模型曾花三天才解出四题,最终拿到银牌。由此可见,Seed Prover1.5 为 AI 数学推理树立了新的标杆。

这一突破离不开大规模强化学习的引入。经过训练,模型在证明题上的成功率从约 50% 提升到接近 90%。此外,Seed Prover1.5 还在北美数学竞赛 Putnam 上刷新了以往的最佳成绩,展现出强劲的解题实力。
在技术报告中,团队提出两项关键创新:Agentic Prover 和 Sketch Model。Agentic Prover 采用全新的形式化推理方式,利用 Lean 等形式语言产出可验证的证明。相比自然语言推理更严谨也更具挑战。为此,Seed Prover1.5 支持在推理中调用多种工具,如检索 Lean 的数学库 Mathlib,或用 Python 脚本完成计算。

Sketch Model 则用于帮助模型先“打草稿”。它模拟人类数学家的思路,允许先写非正式的证明草案,列出关键引理和路径,再转化为形式化证明。借助混合奖励的强化学习策略,Sketch Model 不仅增强了整体推理与规划能力,也有效降低了复杂问题的求解难度。
总之,Seed Prover1.5 不仅展现了字节在 AI 数学推理上的创新与硬实力,也为未来的数学研究与教育带来新的想象空间。
论文地址:https://arxiv.org/pdf/2512.17260


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?