正文:
近日,Perplexity 发布了一套名为 BrowseSafe 的全新安全系统,用来保护 AI 浏览器代理免受网页内容操控。官方表示,其对 Prompt 注入的识别率达到 91%,领先同类方案;例如 PromptGuard-2 仅能发现约 35% 的攻击,而一些前沿大模型如 GPT-5 的检测率约为 85%。此外,BrowseSafe 的速度足够快,能够进行实时守护。
AI 浏览器代理的普及同样带来新的风险。今年早些时候,Perplexity 推出集成 AI 代理的浏览器 Comet。这类代理可像真人用户一样访问站点,并在邮箱、网银与企业系统等已登录会话中执行操作。高权限意味着一旦网页中埋有恶意指令,就可能诱使代理做出不当行为,比如把敏感数据发送到外部地址。
在进一步分析安全问题时,Perplexity 发现现有评测基准如 AgentDojo 难以覆盖复杂的网页攻防场景。它们多依赖简单提示,无法还原真实网页的复杂内容,使攻击者更容易将恶意逻辑隐藏起来。

为解决这一问题,Perplexity 搭建了 BrowseSafe Bench,从三大维度定义网页攻击版图:攻击类型、注入手法与语言风格。该基准尤其关注“难以察觉的内容”,也就是那些看似正常却可能被误判或漏判的复杂材料。借助专家混合架构,BrowseSafe 能在不影响使用体验的前提下并行完成安全扫描。
评估同时也暴露出一些挑战。例如,针对多语言攻击的识别率下降至 76%。另外,把恶意内容藏在 HTML 注释中的情况,比把内容放在显性区域(如页面底部)更容易被检测到。Perplexity 以三层防线应对:先用快速分类器拦截,再结合具备推理能力的前沿大语言模型,形成完整的保护机制。
尽管 BrowseSafe 整体表现优秀,仍有近 10% 的攻击能绕过防御,这也反映出网络环境复杂多变、攻击方式不断进化。对此,Perplexity 已开放其基准、模型与研究论文,希望帮助业界提升 AI 代理的网页交互安全。
划重点:
🌐 BrowseSafe 的检测率达 91%,领先多数现有方案。
🔒 AI 浏览器代理因高权限而面临更高安全风险。
📊 Perplexity 的安全策略聚焦应对复杂多变的网页攻击。


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?