GPT5.2引爆数学圈:半月拿下11道埃尔德什难题,陶哲轩发文点评

最近,数学界见证了人工智能的一次里程碑式突破。前量化研究员 Neel Somani 在测试 GPT5.2 时发现,这个模型只用15分钟思考,就给出了一道数学传奇保罗·埃尔德什(Paul Erdős)未解难题的完整证明,其严谨性已被 Lean 等形式化工具验证。

长期以来,埃尔德什留下的一千多条数学猜想一直被视作人类智慧的边界。然而自去年圣诞节以来,该网站已有 15个问题 被标记为“已解决”,其中 11个方案 明确有 AI 参与。

机器人比赛 答题 数学

Somani 表示,GPT5.2 在数学推理上展现出前所未有的熟练度。它不仅能熟练调用勒让德公式等基础工具,甚至还能在哈佛数学家 Noam Elkies 的既有成果之上,给出更完整的解法。对这类“长尾”数学问题的批量突破,引发了关于 LLM 是否正在拓展人类知识边界的广泛讨论。

菲尔兹奖得主陶哲轩在其 GitHub 页面上进行了详细统计,记录了 8 个由 AI 自主推进的案例。他推测,AI 的可扩展性让它在处理冷门而相对简单的“长尾”问题时,可能比人类更有优势。

除了模型能力的提升,形式化工具(如 Harmonic 公司的 Aristotle)的加入也至关重要。这类工具能把 AI 生成的推理自动转为计算机可验证的代码,大幅简化了核验流程。Harmonic 创始人 Tudor Achim 表示,相比解出多少题目,世界级数学教授开始公开承认使用 AI 工具,才是证明 AI 实力的更有力信号。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享