在OpenAI发布代号“Garlic”的GPT-5.2前夕,谷歌率先推出升级版AI研究代理——Gemini Deep Research。这款基于最新Gemini 3 Pro大模型打造的智能体,不仅能产出高质量的研究报告,更重要的是,它首次通过全新的 Interactions API 面向开发者开放,让开发者可以把谷歌的高级研究能力嵌入到自家应用中。
这意味着谷歌正加速迈向“代理式AI”时代——用户不再亲自搜索,由AI代理替你处理复杂的信息任务。Gemini Deep Research专为应对海量信息与超长上下文场景而生,能够高效整合多源数据流,适用于尽职调查、药物毒性与安全评估等高要求业务。谷歌表示,这一能力很快会集成进Google Search、Google Finance、Gemini App,以及学术界常用的NotebookLM等产品。
为降低代理在长时间推理中容易出现的“幻觉”(凭空编造)风险,Gemini 3 Pro重点强化了事实准确性。在多步骤、长时运行的自主决策链条里,哪怕一次错误推理都可能让整份结果失效,因此模型稳定可靠尤为关键。
为证明技术实力,谷歌发布了专门评估复杂、多跳检索任务的DeepSearchQA新基准,并已将该评测集开源。同时,Gemini Deep Research也参与了两项外部权威测试:一是以冷门、刁钻著称的“人类终极考试”(Humanity’s Last Exam),二是聚焦浏览器自动化的BrowserComp。结果显示,谷歌代理在前两项评测中占优,但在BrowserComp上略逊于OpenAI的ChatGPT 5 Pro。
有点讽刺的是,这些对比数据几乎在发布当天就被刷新——OpenAI随后正式推出GPT-5.2,宣称在包括自家基准在内的多项测试里全面超越竞品,并点名超越谷歌。两家巨头在发布节奏上的精准“卡位”,凸显代理智能赛道竞争之激烈:一方试图用深度研究能力定义下一代AI助手,另一方则以更强的通用推理发起进攻。真正的AI代理之战,或许才刚刚开始。

















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?