GPT-5.2 首次超越人类基线：OpenAI 预示“大模型能力过剩”时代到来-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

AI 领域又迎来一个重要里程碑。OpenAI 联合创始人 Greg Brockman 表示，全新一代模型 GPT-5.2 在 ARC-AGI-2 基准上已超出人类平均线。该评测由 François Chollet 设计，核心在检验模型是否具备真正的抽象推理与类比迁移能力，而不是简单的模式记忆。此成绩意味着，GPT-5.2 在应对从未见过的新题型时已越过“合格门槛”，正向专家级智能迈进。

但在喜讯之余，OpenAI 也给出理性提醒：行业正步入“能力过剩”阶段。换句话说，模型的可为与用户的可用之间存在明显落差。尽管各类实验室指标一路飙升，一旦放入真实工作流程与复杂业务环境，仍会暴露出“指标好看、落地打折”的矛盾。

为此，OpenAI 明确表示，2026 年的发力点将不再只盯着参数规模，而是把重心放在应用层与人机协作上。真正的难点在于，如何让用户高效掌握 AI，并把潜在能力转化为可见的生产力。这一判断正在成为行业共识：AGI 的下一轮竞争，将从单纯堆算力，转向更精巧的软件架构与对真实场景的深度嵌入。

划重点：