多模态视觉大模型12月榜单：Gemini 稳居榜首，豆包与商汤领跑国产阵营-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

最新发布的 SuperCLUE-VLM 12 月多模态视觉语言评测显示，全球各家 AI 大模型竞争火热。本次评测聚焦基础认知、视觉推理与视觉应用三大方向，系统检验各模型的“看得懂”和“想得明白”能力。

本期榜单中，谷歌的Gemini-3-pro以83.64分拿下头名，优势绝对。从细分数据看，其在三项指标上均处于领先，充分体现出国际顶尖模型的深厚实力。国产阵营同样表现亮眼：商汤 SenseNova V6.5Pro 以75.35分位居第二，字节跳动旗下的豆包视觉版以73.15分跻身前三；值得一提的是，豆包在基础认知维度的成绩甚至超过了部分海外强者。

与此同时，百度 ERNIE-5.0-Preview 与阿里巴巴 Qwen3-vl 也成功进入前五。其中，Qwen3-vl 更是成为榜单中首个总分突破 70 分的开源模型，为开源社区带来了强劲的视觉理解能力。

相较之下，国际部分老牌选手表现略显平常。Anthropic 的 Claude-opus-4-5 获得 71.44 分，而 OpenAI 的 GPT-5.2（high）则未能守住第一梯队，仅以 69.16 分排名靠后。榜单的变化也显示，多模态 AI 领域的竞争已经进入白热期。

划重点: