谷歌 AI 概览准确率约 90%,仍易被虚假信息影响

《纽约时报》近日报道,谷歌的 AI 概览(AI Overviews)准确率大约在 90% 左右。以每年超 5 万亿次搜索计算,这意味着每小时可能会产出超过 5700 万条错误答案,平均下来每分钟接近 100 万条错误信息。 

初创公司 Oumi 针对谷歌搜索做了评估,使用 SimpleQA 基准对 4326 次搜索结果进行分析。结果显示,去年 10 月谷歌的 Gemini 2 准确率为 85%,到了今年 2 月,Gemini 3 提升至 91%。不过,Oumi 的评估很大程度依赖于 AI 工具,本身可能带来偏差;此外,谷歌对同一查询有时会给出不同的概览,也让结果更不稳定。

进一步看,AI 概览与原始信息来源不一致的比例从 Gemini 2 的 37% 上升到 Gemini 3 的 56%。这意味着用户常会遇到概览说法与下方链接不一致,或者概览本身虽然正确,但引用的来源却有误。有记者甚至先发布了虚假的博客内容,第二天谷歌的概览就引用了相关信息,显示出 AI 概览容易被操纵。

此外,用户斯蒂芬・潘瓦西在搜索摔跤手胡克・霍根(Hulk Hogan)是否去世时,AI 概览明确表示“没有可信报道显示霍根已去世”,但页面下方却出现了“霍根之死谜团加深”的文章标题。这种自相矛盾的情况让用户更加担心 AI 生成内容的可靠性。

针对这些质疑,谷歌发言人对 Oumi 的测试方法提出了异议,认为其评估未能真实反映用户的搜索行为。

划重点:  

🔍 AI 概览准确率约 90%,按量级估算,每小时可能产生 5700 万条错误答案。  

📈 Gemini 3 准确率升至 91%,但与原始来源不一致的比例增至 56%。  

🤖 AI 概览容易受到虚假信息影响,用户对其可靠性存疑。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享