多模态视觉大模型12月榜单:Gemini 稳居榜首,豆包与商汤领跑国产阵营

最新发布的 SuperCLUE-VLM 12 月多模态视觉语言评测显示,全球各家 AI 大模型竞争火热。本次评测聚焦基础认知、视觉推理与视觉应用三大方向,系统检验各模型的“看得懂”和“想得明白”能力。

image.png

本期榜单中,谷歌的Gemini-3-pro以83.64分拿下头名,优势绝对。从细分数据看,其在三项指标上均处于领先,充分体现出国际顶尖模型的深厚实力。国产阵营同样表现亮眼:商汤 SenseNova V6.5Pro 以75.35分位居第二,字节跳动旗下的豆包视觉版以73.15分跻身前三;值得一提的是,豆包在基础认知维度的成绩甚至超过了部分海外强者。

与此同时,百度 ERNIE-5.0-Preview 与阿里巴巴 Qwen3-vl 也成功进入前五。其中,Qwen3-vl 更是成为榜单中首个总分突破 70 分的开源模型,为开源社区带来了强劲的视觉理解能力。

相较之下,国际部分老牌选手表现略显平常。Anthropic 的 Claude-opus-4-5 获得 71.44 分,而 OpenAI 的 GPT-5.2(high)则未能守住第一梯队,仅以 69.16 分排名靠后。榜单的变化也显示,多模态 AI 领域的竞争已经进入白热期。

划重点:

  • 🏆 全球领跑:谷歌 Gemini-3-pro 以 83.64 分登顶,基础认知、视觉推理与应用三项均位居第一

  • 🇨🇳 国产爆发:商汤 SenseNova 与字节跳动豆包分列二、三位,展现中国大模型在视觉理解上的强势竞争力。

  • 📊 行业洗牌:Qwen3-vl 成为首个突破 70 分的开源模型;GPT-5.2(high)本次视觉评测发挥不及预期,位次靠后。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享