中文视觉大模型新格局:豆包登顶,国产力量全面领跑!

SuperCLUE-VLM 公布了最新一轮中文多模态视觉语言模型评测,给国内 AI 赛道带来重要里程碑。本次榜单中,字节跳动 Doubao-Seed-2.0-Pro-260215 以 90.66 分登上总榜第一,以微弱优势压过谷歌 Gemini-3.1-Pro-Preview(89.35 分)。

image.png

这次评测覆盖海内外 17 款主流视觉语言模型,国产阵营发挥亮眼,多款模型挤进前列,阿里巴巴的 Qwen3.5 系列、商汤的 SenseNova,以及智谱 GLM 等成绩不俗。相比之下,OpenAI 的 GPT-5.4 和其他部分海外热门模型整体多位列中游,凸显国产模型的强劲上升势头。

评测围绕三大维度展开:基础认知、视觉推理、视觉应用,共包含 25 个细分任务,覆盖通用识别、医疗影像等。结果显示,国产模型在基础认知与数据分析方面优势明显,普遍突破 90 分,能力成熟稳定。但在视觉推理以及工业、医疗等专业落地场景上,仍存在提升空间,个别任务分数偏低。

划重点:  

🌟 Doubao-Seed-2.0-Pro-260215 以 90.66 分登顶总榜第一,小幅领先谷歌 Gemini-3.1-Pro-Preview。  

📊 国产模型在基础认知与数据分析上多项成绩超 90 分,表现稳定可靠。  

🛠️ 在视觉推理与专业应用方面仍需打磨,部分场景得分不高。  

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享