谷歌 AI 概览准确率约 90%，仍易被虚假信息影响-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

《纽约时报》近日报道，谷歌的 AI 概览（AI Overviews）准确率大约在 90% 左右。以每年超 5 万亿次搜索计算，这意味着每小时可能会产出超过 5700 万条错误答案，平均下来每分钟接近 100 万条错误信息。

初创公司 Oumi 针对谷歌搜索做了评估，使用 SimpleQA 基准对 4326 次搜索结果进行分析。结果显示，去年 10 月谷歌的 Gemini 2 准确率为 85%，到了今年 2 月，Gemini 3 提升至 91%。不过，Oumi 的评估很大程度依赖于 AI 工具，本身可能带来偏差；此外，谷歌对同一查询有时会给出不同的概览，也让结果更不稳定。

进一步看，AI 概览与原始信息来源不一致的比例从 Gemini 2 的 37% 上升到 Gemini 3 的 56%。这意味着用户常会遇到概览说法与下方链接不一致，或者概览本身虽然正确，但引用的来源却有误。有记者甚至先发布了虚假的博客内容，第二天谷歌的概览就引用了相关信息，显示出 AI 概览容易被操纵。

此外，用户斯蒂芬・潘瓦西在搜索摔跤手胡克・霍根（Hulk Hogan）是否去世时，AI 概览明确表示“没有可信报道显示霍根已去世”，但页面下方却出现了“霍根之死谜团加深”的文章标题。这种自相矛盾的情况让用户更加担心 AI 生成内容的可靠性。

针对这些质疑，谷歌发言人对 Oumi 的测试方法提出了异议，认为其评估未能真实反映用户的搜索行为。