字节 Seed 新模型亮相：数学金牌表现抢眼，AI 推理进入新阶段！-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

最近，字节跳动旗下的 Seed AI 团队推出了数学推理模型 Seed Prover1.5。该模型在国际数学奥林匹克（IMO）中发挥出色，成功斩获金牌，意味着人工智能在数学领域又迈出关键一步。

Seed Prover1.5 基于 Scaling Law 的训练思路，在 16.5 小时内解出 IMO2025 的前五道题，仅有一题未攻克，最终以 35 分达到金牌线。这一表现与谷歌 Gemini 不相上下。相比之下，字节此前的模型曾花三天才解出四题，最终拿到银牌。由此可见，Seed Prover1.5 为 AI 数学推理树立了新的标杆。

这一突破离不开大规模强化学习的引入。经过训练，模型在证明题上的成功率从约 50% 提升到接近 90%。此外，Seed Prover1.5 还在北美数学竞赛 Putnam 上刷新了以往的最佳成绩，展现出强劲的解题实力。

在技术报告中，团队提出两项关键创新：Agentic Prover 和 Sketch Model。Agentic Prover 采用全新的形式化推理方式，利用 Lean 等形式语言产出可验证的证明。相比自然语言推理更严谨也更具挑战。为此，Seed Prover1.5 支持在推理中调用多种工具，如检索 Lean 的数学库 Mathlib，或用 Python 脚本完成计算。

Sketch Model 则用于帮助模型先“打草稿”。它模拟人类数学家的思路，允许先写非正式的证明草案，列出关键引理和路径，再转化为形式化证明。借助混合奖励的强化学习策略，Sketch Model 不仅增强了整体推理与规划能力，也有效降低了复杂问题的求解难度。

总之，Seed Prover1.5 不仅展现了字节在 AI 数学推理上的创新与硬实力，也为未来的数学研究与教育带来新的想象空间。

论文地址：https://arxiv.org/pdf/2512.17260