ChatGPT-5.2 首次独立完成数学猜想证明,“氛围证明”时代拉开帷幕

近日,比利时布鲁塞尔自由大学(VUB)公布一项足以写进 AI 历史的成果:商用大模型已经可以独立产出原创数学证明。实验表明,OpenAI 的 ChatGPT-5.2(Thinking)成功攻克了数学家 Ran 与 Teng 于 2024 年提出的一项未解猜想。

机器人竞赛 解题 数学

图源说明:图片由 AI 生成,授权服务商为 Midjourney

这一进展意味着大语言模型(LLM)的能力已不再局限于写代码和生成文本,而是迈入了对逻辑严密性要求非常高的理论数学。学界反响热烈,普遍认为这预示着科学发现方式正迎来根本变化。

“氛围证明”登场:在对话里孕育出的数学定理

团队把这类新式科研流程称为“vibe-proving(氛围证明)”,灵感来自最近走红的“氛围编程”。在证明全程中,ChatGPT 自主探索证明思路并搭建核心逻辑框架,展现出不止于“拼接数据”的原创推理。

这次证明经历了 7 轮对话和 4 次自我修订,最终产出一套严密的论证链。尽管最终把关仍由人类完成,但 AI 的推演速度远超多数数学家的预期。

行业重心转移:人类从“产出者”走向“审核者”

VUB 教授 Vincent Ginis 表示,这一结果打破了“AI 只会归纳、不具创造”的偏见。随着 AI 产出数学证明的门槛下降,理论数学的推进速度有望大幅提升。

接下来,数学研究的关键瓶颈或将从“找路径”转到“验正确性”。一旦 AI 能批量产出高质量的猜想证明草案,如何高效、自动化地完成验证,将成为新的技术制高点。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享