中文大模型全球榜单出炉!海外三强占据前排,国产势头亮眼!

近日,SuperCLUE 公布了 2025 年度中文大模型基准测评报告,迅速引发科技圈关注。本次评测集结了海内外 23 个大模型,覆盖数学推理、科学推理、代码生成等六大核心维度。结果显示,海外闭源模型仍占优势,尤其是 Anthropic 的 Claude-Opus-4.5-Reasoning 以 68.25 分登顶,成为本次评测的最大赢家。

紧随其后的是谷歌的 Gemini-3-Pro-Preview 和 OpenAI 的 GPT-5.2(high),分别以 65.59 分和 64.32 分拿下第二、第三。值得一提的是,国产模型同样表现不俗:开源模型 Kimi-K2.5-Thinking 和闭源模型 Qwen3-Max-Thinking 分别以 61.50 分与 60.61 分位列第四和第六,成绩亮眼。

全球中文大模型战力榜发布:前三被海外包揽 国产有惊喜

在细分任务上,国产模型表现更为突出。Kimi-K2.5-Thinking 以 53.33 分拿下代码生成第一;而在数学推理任务中,Qwen3-Max-Thinking 与 Gemini-3-Pro-Preview 并列第一,成绩为 80.87 分。这些数据表明,国产模型正从“跟跑”迈向“并跑”,展现出强劲的追赶势头。

总体看,海外闭源模型仍领先于国产模型,但国产开源模型表现抢眼,在 Top5 中占据了绝对优势,显示出强大实力与发展潜力。随着技术持续进步与国内研发加速,中文大模型赛道未来有望带来更多惊喜与挑战。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享