SuperCLUE-VLM 12月多模态视觉语言基准最新发布,全球多家 AI 大模型展开激烈比拼。此次评测围绕基础认知、视觉推理与视觉应用三大维度展开,全面检验模型的“看图理解”和“综合思考”能力。

本轮榜单中,谷歌的
此外,百度 ERNIE-5.0-Preview 与阿里巴巴 Qwen3-vl 也进入前五。其中,Qwen3-vl 成为榜单中首个总分突破70分的开源模型,为开源社区带来不俗的视觉解析能力。
相比之下,部分国际老牌选手本期表现略显一般。Anthropic 的 Claude-opus-4-5 获得71.44分,而 OpenAI 的 GPT-5.2(high)未能挤入第一梯队,仅以69.16分靠后。排名变化也显示,多模态 AI 赛道的竞争正在加速升温。
划重点:
-
🏆 全球拔尖: 谷歌 Gemini-3-pro 以83.64分登顶,基础认知、视觉推理与应用三项均位列第一。
-
🇨🇳 国产亮眼: 商汤 SenseNova 与字节跳动豆包分居第二、第三,展现中国模型在视觉理解上的强劲竞争力。
-
📊 格局变化: Qwen3-vl 成为首个总分破70的开源模型;GPT-5.2(high)本次视觉测评表现偏弱,排名靠后。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?