GPT5.2震动数学圈:半月内解出11道埃尔德什难题,陶哲轩发文统计与点评

最近,数学界迎来一项具有里程碑意义的突破。前量化研究员 Neel Somani 在测试 GPT5.2 时发现,这个模型只花了15分钟思考,就给出了一道数学传奇保罗·埃尔德什(Paul Erdős)未解题的完整证明,而且已经通过 Lean 等形式化工具核验,严谨可靠。

一直以来,埃尔德什留下的上千个猜想被视为人类智慧的极限。不过,自去年圣诞节以来,相关网站上已有15个问题被标记为“已解决”,其中11个方案明确有 AI 参与。

机器人比赛 答题 数学

Somani 表示,GPT5.2在数学推理方面展现出前所未有的熟练度。它不但能灵活使用勒让德公式等基础工具,还在哈佛数学家 Noam Elkies 的既有成果上,提出了更完整的解法。对于这类“长尾”数学难题的批量突破,也让人们讨论:LLM 是否正在拓展人类知识的边界。

菲尔兹奖得主陶哲轩在自己的 GitHub 页面上做了详细统计,记录了8个由 AI 自主推进的案例。他推测,AI 的可扩展性使其在处理冷门但相对简单的“长尾”问题上,可能比人类更有优势。

除了模型本身的进步,形式化工具(如 Harmonic 公司的 Aristotle)也至关重要。这类工具能把 AI 生成的推理自动转成可由计算机验证的代码,极大地简化了验证流程。Harmonic 创始人 Tudor Achim 表示,与其看解题数量,世界级数学教授开始公开承认使用 AI 工具,才是更能证明 AI 实力的信号。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享