AI智商基准榜易主：Claude Opus 4.6 反超 GPT-5.2 登顶-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

大模型赛道再起波澜。基于最新发布的 Artificial Analysis 智能指数，Anthropic 的旗舰模型Claude Opus4.6以出色表现脱颖而出，强势登上该权威榜单榜首。该指数整合了编程、代理任务与科学推理等十项深度测评，Opus4.6在代理型工作、终端编程以及物理研究课题上均拿下第一。

值得关注的是，尽管 Opus4.6的运行成本高达2，486美元，略高于 OpenAIGPT-5.2的2，304美元，但在效率上呈现出明显差异。数据显示，Opus4.6在测试过程中输出约5，800万个 Token，这一数字是前代机型4.5的两倍；而相比 GPT-5.2高达1.3亿个 Token，Opus4.6在信息密度与处理逻辑上更为精炼。目前，该模型已全面上线Claude.ai平台，并支持通过 Google Vertex、AWS Bedrock 等主流云服务进行调用。

不过，Anthropic 的领先优势正面临考验。行业巨头 OpenAI 的新一代编程利器Codex5.3已进入备测名单。分析人士认为，一旦 Codex5.3 完成全部基准测试，其在代码编写及相关逻辑能力上的长处，极有可能帮助其重夺桂冠。这场“全球最聪明模型”的争夺战，显然尚未到定论之时。