最近,数学界迎来一项具有里程碑意义的突破。前量化研究员 Neel Somani 在测试 GPT5.2 时发现,这个模型只花了15分钟思考,就给出了一道数学传奇保罗·埃尔德什(Paul Erdős)未解题的完整证明,而且已经通过 Lean 等形式化工具核验,严谨可靠。
一直以来,埃尔德什留下的上千个猜想被视为人类智慧的极限。不过,自去年圣诞节以来,相关网站上已有15个问题被标记为“已解决”,其中11个方案明确有 AI 参与。

Somani 表示,GPT5.2在数学推理方面展现出前所未有的熟练度。它不但能灵活使用勒让德公式等基础工具,还在哈佛数学家 Noam Elkies 的既有成果上,提出了更完整的解法。对于这类“长尾”数学难题的批量突破,也让人们讨论:LLM 是否正在拓展人类知识的边界。
菲尔兹奖得主陶哲轩在自己的 GitHub 页面上做了详细统计,记录了8个由 AI 自主推进的案例。他推测,AI 的可扩展性使其在处理冷门但相对简单的“长尾”问题上,可能比人类更有优势。
除了模型本身的进步,形式化工具(如 Harmonic 公司的 Aristotle)也至关重要。这类工具能把 AI 生成的推理自动转成可由计算机验证的代码,极大地简化了验证流程。Harmonic 创始人 Tudor Achim 表示,与其看解题数量,世界级数学教授开始公开承认使用 AI 工具,才是更能证明 AI 实力的信号。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?