最新发布的 SuperCLUE-VLM 12 月多模态视觉语言评测显示,全球各家 AI 大模型竞争火热。本次评测聚焦基础认知、视觉推理与视觉应用三大方向,系统检验各模型的“看得懂”和“想得明白”能力。

本期榜单中,谷歌的
与此同时,百度 ERNIE-5.0-Preview 与阿里巴巴 Qwen3-vl 也成功进入前五。其中,Qwen3-vl 更是成为榜单中首个总分突破 70 分的开源模型,为开源社区带来了强劲的视觉理解能力。
相较之下,国际部分老牌选手表现略显平常。Anthropic 的 Claude-opus-4-5 获得 71.44 分,而 OpenAI 的 GPT-5.2(high)则未能守住第一梯队,仅以 69.16 分排名靠后。榜单的变化也显示,多模态 AI 领域的竞争已经进入白热期。
划重点:
-
🏆 全球领跑:谷歌 Gemini-3-pro 以 83.64 分登顶,基础认知、视觉推理与应用三项均位居第一。
-
🇨🇳 国产爆发:商汤 SenseNova 与字节跳动豆包分列二、三位,展现中国大模型在视觉理解上的强势竞争力。
-
📊 行业洗牌:Qwen3-vl 成为首个突破 70 分的开源模型;GPT-5.2(high)本次视觉评测发挥不及预期,位次靠后。


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?