字节 Seed 推出新一代模型:斩获数学奥赛金牌,AI 推理进入加速期!

近期,字节跳动旗下的 Seed AI 团队发布数学推理模型 Seed Prover1.5,在国际数学奥林匹克(IMO)赛场表现亮眼,成功拿下金牌,意味着人工智能在数学领域又迈出坚实一步。

Seed Prover1.5基于 Scaling Law 思路训练,仅用16.5小时就攻克 IMO2025 的前五题,仅有一题未通过,最终以35分达到金牌线,成绩与谷歌 Gemini 不相上下。相比之下,字节此前的模型要花三天时间才能完成四道题,最后只拿到银牌。可以说,Seed Prover1.5为 AI 数学推理树立了新的标杆。

image.png

这次突破离不开大规模强化学习。训练后,模型在证明类题目的成功率从约50% 提升到接近90%。此外,Seed Prover1.5还在北美数学竞赛 Putnam 上刷新了历届最佳成绩,进一步展现了强大的解题能力。

技术报告披露了两项关键创新:Agentic Prover 与 Sketch Model。Agentic Prover 引入全新的形式化推理流程,使用 Lean 等形式语言给出可验证的证明。相较于传统的自然语言推理,这种方式更严谨,但难度也更高。为此,Seed Prover1.5支持在推理过程中调用多种工具,例如检索 Lean 的数学库 Mathlib,以及编写 Python 脚本进行计算。

image.png

Sketch Model 则帮助模型先“打草稿”。它模拟人类数学家的思考路径,先写非正式证明草案,列出关键引理与思路,再转成形式化证明。通过混合奖励信号的强化学习策略,Sketch Model 不仅提升整体的逻辑规划能力,还有效降低处理复杂问题的难度。

总体来看,Seed Prover1.5不仅体现了字节在 AI 数学推理上的创新与实力,也为未来的数学研究与教育带来新的可能性。

论文地址:https://arxiv.org/pdf/2512.17260

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享