AI智商基准榜易主:Claude Opus 4.6 反超 GPT-5.2 登顶

大模型赛道再起波澜。基于最新发布的 Artificial Analysis 智能指数,Anthropic 的旗舰模型Claude Opus4.6以出色表现脱颖而出,强势登上该权威榜单榜首。该指数整合了编程、代理任务与科学推理等十项深度测评,Opus4.6在代理型工作、终端编程以及物理研究课题上均拿下第一

image.png

值得关注的是,尽管 Opus4.6的运行成本高达2,486美元,略高于 OpenAIGPT-5.2的2,304美元,但在效率上呈现出明显差异。数据显示,Opus4.6在测试过程中输出约5,800万个 Token,这一数字是前代机型4.5的两倍;而相比 GPT-5.2高达1.3亿个 Token,Opus4.6在信息密度与处理逻辑上更为精炼。目前,该模型已全面上线Claude.ai平台,并支持通过 Google Vertex、AWS Bedrock 等主流云服务进行调用。

不过,Anthropic 的领先优势正面临考验。行业巨头 OpenAI 的新一代编程利器Codex5.3已进入备测名单。分析人士认为,一旦 Codex5.3 完成全部基准测试,其在代码编写及相关逻辑能力上的长处,极有可能帮助其重夺桂冠。这场“全球最聪明模型”的争夺战,显然尚未到定论之时。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享