谷歌Gemini 3发布即登顶LMArena榜单,马斯克与阿尔特曼同贺

谷歌正式发布Gemini 3后,Gemini 3 Pro拿下1501 Elo,在LMArena公开榜创下历史最高分,力压GPT-5.1、Claude 4. 5 与Grok-4.1,成为当下评分最高的多模态模型。

在性能上,Gemini 3 Pro在人类终极考试得分37.5%,GPQA Diamond为91.9%;在MMMU-Pro与Video-MMMU上分别取得81%和87.6%,展现其在科学、数学与视频理解任务上的全面领先。其增强推理模式Deep Think又把人类终极考试提升至41%,ARC-AGI- 2 得分45.1%,刷新通用智能评测纪录。

发布之后,OpenAI CEO Sam Altman在X平台发文称“Gemini3 看起来很不错”,谷歌CEO Sundar Pichai以“🙏”回应;Elon Musk亦在LMArena官方账号留言“确实值得祝贺”,并透露Grok 4. 20 将很快发布。

在市场层面,Altman在随后流出的内部备忘录中直言,谷歌的快速推进可能给OpenAI带来“暂时性经济阻力”,并提醒员工未来外界评价会“相当严苛”,这也表明Gemini3的强势表现正加剧硅谷AI竞争格局。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享