谷歌火速上线Gemini Deep Research迎战GPT-5.2，AI“研究代理”大战拉开序幕-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

在OpenAI发布代号“Garlic”的GPT-5.2前夕，谷歌率先推出升级版AI研究代理——Gemini Deep Research。这款基于最新Gemini 3 Pro大模型打造的智能体，不仅能产出高质量的研究报告，更重要的是，它首次通过全新的 Interactions API 面向开发者开放，让开发者可以把谷歌的高级研究能力嵌入到自家应用中。

这意味着谷歌正加速迈向“代理式AI”时代——用户不再亲自搜索，由AI代理替你处理复杂的信息任务。Gemini Deep Research专为应对海量信息与超长上下文场景而生，能够高效整合多源数据流，适用于尽职调查、药物毒性与安全评估等高要求业务。谷歌表示，这一能力很快会集成进Google Search、Google Finance、Gemini App，以及学术界常用的NotebookLM等产品。

为降低代理在长时间推理中容易出现的“幻觉”（凭空编造）风险，Gemini 3 Pro重点强化了事实准确性。在多步骤、长时运行的自主决策链条里，哪怕一次错误推理都可能让整份结果失效，因此模型稳定可靠尤为关键。

为证明技术实力，谷歌发布了专门评估复杂、多跳检索任务的DeepSearchQA新基准，并已将该评测集开源。同时，Gemini Deep Research也参与了两项外部权威测试：一是以冷门、刁钻著称的“人类终极考试”（Humanity’s Last Exam），二是聚焦浏览器自动化的BrowserComp。结果显示，谷歌代理在前两项评测中占优，但在BrowserComp上略逊于OpenAI的ChatGPT 5 Pro。

有点讽刺的是，这些对比数据几乎在发布当天就被刷新——OpenAI随后正式推出GPT-5.2，宣称在包括自家基准在内的多项测试里全面超越竞品，并点名超越谷歌。两家巨头在发布节奏上的精准“卡位”，凸显代理智能赛道竞争之激烈：一方试图用深度研究能力定义下一代AI助手，另一方则以更强的通用推理发起进攻。真正的AI代理之战，或许才刚刚开始。