SuperCLUE-VLM 12月多模态视觉语言基准最新发布,全球 AI 大模型展开了激烈比拼。本次评测聚焦基础认知、视觉推理与视觉应用三大维度,全面检验各模型的“看得准”和“想得透”。

此次榜单中,谷歌的
此外,百度 ERNIE-5.0-Preview 与阿里巴巴的 Qwen3-vl 也成功挤进前五。其中,Qwen3-vl 成为榜单中首个总分突破70分的开源模型,为开源社区贡献了强劲的视觉解析能力。
相较之下,部分国际老牌选手本次表现略显平淡。Anthropic 的 Claude-opus-4-5 收获71.44分,而 OpenAI 的 GPT-5.2(high)则意外跌出第一梯队,仅以69.16分排名靠后。这一变化也预示着多模态 AI 赛道的竞争正在加速升温。
划重点:
-
🏆 全球领跑: 谷歌 Gemini-3-pro 以83.64分登顶,在基础认知、视觉推理和应用三项指标上均居第一。
-
🇨🇳 国产爆发: 商汤 SenseNova 与字节跳动豆包分列第二、第三,体现中国大模型在视觉理解领域的强劲实力。
-
📊 行业洗牌: Qwen3-vl 成为首个破70分的开源模型,而 GPT-5.2(high)在本次视觉测评中发挥不及预期,位居后列。


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?