近日,比利时布鲁塞尔自由大学(VUB)公布一项足以写进 AI 历史的成果:商用大模型已经可以独立产出原创数学证明。实验表明,OpenAI 的 ChatGPT-5.2(Thinking)成功攻克了数学家 Ran 与 Teng 于 2024 年提出的一项未解猜想。

图源说明:图片由 AI 生成,授权服务商为 Midjourney
这一进展意味着大语言模型(LLM)的能力已不再局限于写代码和生成文本,而是迈入了对逻辑严密性要求非常高的理论数学。学界反响热烈,普遍认为这预示着科学发现方式正迎来根本变化。
“氛围证明”登场:在对话里孕育出的数学定理
团队把这类新式科研流程称为“vibe-proving(氛围证明)”,灵感来自最近走红的“氛围编程”。在证明全程中,ChatGPT 自主探索证明思路并搭建核心逻辑框架,展现出不止于“拼接数据”的原创推理。
这次证明经历了 7 轮对话和 4 次自我修订,最终产出一套严密的论证链。尽管最终把关仍由人类完成,但 AI 的推演速度远超多数数学家的预期。
行业重心转移:人类从“产出者”走向“审核者”
VUB 教授 Vincent Ginis 表示,这一结果打破了“AI 只会归纳、不具创造”的偏见。随着 AI 产出数学证明的门槛下降,理论数学的推进速度有望大幅提升。
接下来,数学研究的关键瓶颈或将从“找路径”转到“验正确性”。一旦 AI 能批量产出高质量的猜想证明草案,如何高效、自动化地完成验证,将成为新的技术制高点。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?