谷歌推出Gemini 3：百万级上下文对标GPT-5.1，LMArena榜首-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

Alphabet旗下谷歌正式推出Gemini3，首次带来100万tokens的上下文窗口，原生支持文本、图片、视频与代码的多模态推理。官方表示，Gemini3Pro在GPQA Diamond研究生级测试中取得91.9%准确率，在LMArena以1501Elo登顶，超越GPT-5.1与Claude4.5，成为当前公开榜单最高分的模型。

Gemini3采用全新的Deep Think增强推理模式，通过“思维签名”和“思考等级”把推理链产品化，ARC-AGI-2得分45.1%，在多步逻辑、事实准确性与科学图表理解等维度刷新SOTA。谷歌同步推出Google Antigravity开发平台，支持“代理式编码”与“可视化编码”，LiveCodeBench Pro Elo2439，Terminal-Bench2.0终端操作准确率54.2%，可自主完成数据爬取、分析、报告与部署的全链路。

Gemini3即日起面向Google AI Ultra订阅用户开放，未来几周将陆续覆盖Gemini应用、AI Mode搜索与企业级Vertex AI。谷歌称，模型在自研TPU v6Pods上训练，结合90%搜索市占与每月20亿“AI概览”用户，将加速AI从实验室走向生产线。