多模态视觉大模型12月战报:Gemini 强势领跑,豆包与商汤位居国产前列

SuperCLUE-VLM 12月多模态视觉语言评测刚刚发布,全球 AI 大模型竞争火热。本次评测聚焦基础认知、视觉推理与视觉应用三大维度,全面检验各家模型的“眼力”和“脑力”。

image.png

在本次比拼中,谷歌推出的Gemini-3-pro以83.64分的绝对优势拿下榜首。数据细看,其在三项细分指标上均实现全面领先,展现出国际顶尖模型的深厚实力。而在国产模型方面,整体表现同样亮眼。商汤科技的 SenseNova V6.5Pro 以75.35分紧随其后位居次席,字节跳动旗下的豆包视觉版则以73.15分跻身前三。值得关注的是,豆包在基础认知上的表现甚至超过了部分国际强手。

此外,百度 ERNIE-5.0-Preview 与阿里巴巴的 Qwen3-vl 也进入榜单前五。其中,Qwen3-vl 更是成为榜单中首个总分突破70分的开源模型,为开源社区带来了扎实的视觉解析能力。

相较之下,部分国际老牌选手这次表现略显平稳。Anthropic 的 Claude-opus-4-5 获得71.44分,而 OpenAI 的 GPT-5.2(high) 则意外跌出第一梯队,仅以69.16分排名靠后。这一排名变化也显示,多模态 AI 领域的竞争正进入白热化阶段。

划重点:

  • 🏆 全球领跑: 谷歌 Gemini-3-pro 以83.64分登顶,在基础认知、视觉推理和应用三项指标上均居第一

  • 🇨🇳 国产发力: 商汤 SenseNova 与字节跳动豆包分列二、三名,展现中国大模型在视觉理解领域的强劲实力。

  • 📊 行业新格局: Qwen3-vl 成为首个破70分的开源模型,而 GPT-5.2(high)在本次视觉测评中表现不及预期,排名靠后。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享