字节 Seed 推出新一代模型：斩获数学奥赛金牌，AI 推理进入加速期！-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

近期，字节跳动旗下的 Seed AI 团队发布数学推理模型 Seed Prover1.5，在国际数学奥林匹克（IMO）赛场表现亮眼，成功拿下金牌，意味着人工智能在数学领域又迈出坚实一步。

Seed Prover1.5基于 Scaling Law 思路训练，仅用16.5小时就攻克 IMO2025 的前五题，仅有一题未通过，最终以35分达到金牌线，成绩与谷歌 Gemini 不相上下。相比之下，字节此前的模型要花三天时间才能完成四道题，最后只拿到银牌。可以说，Seed Prover1.5为 AI 数学推理树立了新的标杆。

这次突破离不开大规模强化学习。训练后，模型在证明类题目的成功率从约50% 提升到接近90%。此外，Seed Prover1.5还在北美数学竞赛 Putnam 上刷新了历届最佳成绩，进一步展现了强大的解题能力。

技术报告披露了两项关键创新：Agentic Prover 与 Sketch Model。Agentic Prover 引入全新的形式化推理流程，使用 Lean 等形式语言给出可验证的证明。相较于传统的自然语言推理，这种方式更严谨，但难度也更高。为此，Seed Prover1.5支持在推理过程中调用多种工具，例如检索 Lean 的数学库 Mathlib，以及编写 Python 脚本进行计算。

Sketch Model 则帮助模型先“打草稿”。它模拟人类数学家的思考路径，先写非正式证明草案，列出关键引理与思路，再转成形式化证明。通过混合奖励信号的强化学习策略，Sketch Model 不仅提升整体的逻辑规划能力，还有效降低处理复杂问题的难度。

总体来看，Seed Prover1.5不仅体现了字节在 AI 数学推理上的创新与实力，也为未来的数学研究与教育带来新的可能性。

论文地址：https://arxiv.org/pdf/2512.17260