谷歌推出Gemini 3:百万级上下文对标GPT-5.1,LMArena榜首

Alphabet旗下谷歌正式推出Gemini3,首次带来100万tokens的上下文窗口,原生支持文本、图片、视频与代码的多模态推理。官方表示,Gemini3Pro在GPQA Diamond研究生级测试中取得91.9%准确率,在LMArena以1501Elo登顶,超越GPT-5.1与Claude4.5,成为当前公开榜单最高分的模型。

Gemini3采用全新的Deep Think增强推理模式,通过“思维签名”和“思考等级”把推理链产品化,ARC-AGI-2得分45.1%,在多步逻辑、事实准确性与科学图表理解等维度刷新SOTA。谷歌同步推出Google Antigravity开发平台,支持“代理式编码”与“可视化编码”,LiveCodeBench Pro Elo2439,Terminal-Bench2.0终端操作准确率54.2%,可自主完成数据爬取、分析、报告与部署的全链路。

Gemini3即日起面向Google AI Ultra订阅用户开放,未来几周将陆续覆盖Gemini应用、AI Mode搜索与企业级Vertex AI。谷歌称,模型在自研TPU v6Pods上训练,结合90%搜索市占与每月20亿“AI概览”用户,将加速AI从实验室走向生产线。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享