中文大模型全球榜单出炉！海外三强占据前排，国产势头亮眼！-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

近日，SuperCLUE 公布了 2025 年度中文大模型基准测评报告，迅速引发科技圈关注。本次评测集结了海内外 23 个大模型，覆盖数学推理、科学推理、代码生成等六大核心维度。结果显示，海外闭源模型仍占优势，尤其是 Anthropic 的 Claude-Opus-4.5-Reasoning 以 68.25 分登顶，成为本次评测的最大赢家。

紧随其后的是谷歌的 Gemini-3-Pro-Preview 和 OpenAI 的 GPT-5.2（high），分别以 65.59 分和 64.32 分拿下第二、第三。值得一提的是，国产模型同样表现不俗：开源模型 Kimi-K2.5-Thinking 和闭源模型 Qwen3-Max-Thinking 分别以 61.50 分与 60.61 分位列第四和第六，成绩亮眼。

全球中文大模型战力榜发布：前三被海外包揽国产有惊喜

在细分任务上，国产模型表现更为突出。Kimi-K2.5-Thinking 以 53.33 分拿下代码生成第一；而在数学推理任务中，Qwen3-Max-Thinking 与 Gemini-3-Pro-Preview 并列第一，成绩为 80.87 分。这些数据表明，国产模型正从“跟跑”迈向“并跑”，展现出强劲的追赶势头。

总体看，海外闭源模型仍领先于国产模型，但国产开源模型表现抢眼，在 Top5 中占据了绝对优势，显示出强大实力与发展潜力。随着技术持续进步与国内研发加速，中文大模型赛道未来有望带来更多惊喜与挑战。