GPT-5.2 首破人类基线：OpenAI 警示“大模型能力过剩”时代来临-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

人工智能又迎来一个新里程碑。OpenAI 联合创始人 Greg Brockman 近日表示，最新一代大模型 GPT-5.2 在 ARC-AGI-2 基准测试上的成绩已超越人类平均基线。该测试由 François Chollet 设计，专门用来检验 AI 是否具备真正的抽象推理与迁移能力，而不是简单的模式记忆。这个突破意味着，GPT-5.2 在处理从未见过的新任务时，已跨过“合格线”，正向更接近专家级的智能迈进。

同时，OpenAI 也给出冷静提醒：行业正进入“能力过剩”阶段。这表示大模型“能做到”的与用户“用得好”的之间出现明显落差。尽管实验室指标亮眼，但当 AI 融入真实工作流程和复杂业务时，仍会出现“纸面强、落地难”的悖论。

针对这一情况，OpenAI 表示 2026 年的重点将不再只是追求参数与规模，而是转向应用层与人机协同。核心挑战在于如何教会用户高效使用 AI，并把模型能力转化为真实的生产力。业内也逐步形成共识：下一阶段 AGI 的竞争焦点，将从单纯的算力堆叠，转向更高效的软件架构与对真实场景的深度结合。

划重点：