国产大模型加速崛起！豆包挺进全球第一梯队，小米 MiMo 数学推理成绩亮眼-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

国产大模型加速崛起！豆包挺进全球第一梯队，小米 MiMo 数学推理成绩亮眼

拥抱AI，AIGC最佳实践者

6913

中国大模型正加速从“跟跑”走向“并跑”，在一些赛道上开始“领跑”。

3月30日，中文大模型基准测评SuperCLUE公布了2026年3月最新榜单。本次共有22款海内外主流模型参评，覆盖数学推理、科学推理、代码生成等六大关键任务。结果显示，以“豆包”为代表的国产模型已顺利挺进全球顶尖阵营。

全球视角：海外闭源仍占上风，豆包紧紧跟进

从本次测评的总分榜来看，海外闭源模型依旧展现出深厚实力：

前三强: Anthropic 的Claude-Opus-4.6、Google 的Gemini-3.1-Pro以及 OpenAI 的GPT-5.4位列全球前三。

国产之光: 字节跳动旗下的豆包（Doubao-Seed-2.0-pro）以71.53分夺得国内第一，稳居全球第一梯队，与 GPT-5.4 的差距缩小至0.95分。

智能体突破: 在智能体的任务规划维度，豆包实现反超部分海外模型，跻身全球前五。

小米表现：MiMo-V2 系列数学推理能力突出

作为手机厂商跨界 AI 的代表，小米集团的 MiMo 系列在本次评测中表现稳定：

数学尖子生: MiMo-V2-Pro以60.67分位列闭源模型前列，在数学推理任务中拿下84.03分的高分。

双模上榜: 除 Pro 版本外，开源版本的MiMo-V2-Flash也同步上榜，在代码生成等细分场景中展现出良好的进化潜力。

开源赛道：国产模型实现“包揽式”领先

相较闭源领域的鏖战，国产模型在开源赛道展现出统治级优势：

包揽前三: Kimi-K2.5-Thinking与Qwen3.5-397B等国产开源模型包揽开源榜单前三。

降维打击: 测评数据显示，国产开源模型在整体表现上已显著领先海外同类开源产品，成为全球开发者的新宠。

结语：从“参数比拼”迈向“能力实战”

从这份2026年3月榜单可以看到，中文大模型不再只满足于中文语境理解，而是在逻辑推理、代码生成等硬核领域与全球顶级模型正面较量。随着豆包持续上位，以及小米 MiMo在细分能力上的深耕，国产大模型正迎来真正的“实战爆发期”。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区

© 版权声明

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

喜欢就支持一下吧

相关推荐