谷歌正式发布Gemini 3后,Gemini 3 Pro拿下1501 Elo,在LMArena公开榜创下历史最高分,力压GPT-5.1、Claude 4. 5 与Grok-4.1,成为当下评分最高的多模态模型。
在性能上,Gemini 3 Pro在人类终极考试得分37.5%,GPQA Diamond为91.9%;在MMMU-Pro与Video-MMMU上分别取得81%和87.6%,展现其在科学、数学与视频理解任务上的全面领先。其增强推理模式Deep Think又把人类终极考试提升至41%,ARC-AGI- 2 得分45.1%,刷新通用智能评测纪录。
发布之后,OpenAI CEO Sam Altman在X平台发文称“Gemini3 看起来很不错”,谷歌CEO Sundar Pichai以“🙏”回应;Elon Musk亦在LMArena官方账号留言“确实值得祝贺”,并透露Grok 4. 20 将很快发布。
在市场层面,Altman在随后流出的内部备忘录中直言,谷歌的快速推进可能给OpenAI带来“暂时性经济阻力”,并提醒员工未来外界评价会“相当严苛”,这也表明Gemini3的强势表现正加剧硅谷AI竞争格局。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?