Perplexity 发布 BrowseSafe：为 AI 浏览器代理筑起安全护栏-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

正文：

近日，Perplexity 发布了一套名为 BrowseSafe 的全新安全系统，用来保护 AI 浏览器代理免受网页内容操控。官方表示，其对 Prompt 注入的识别率达到 91%，领先同类方案；例如 PromptGuard-2 仅能发现约 35% 的攻击，而一些前沿大模型如 GPT-5 的检测率约为 85%。此外，BrowseSafe 的速度足够快，能够进行实时守护。

AI 浏览器代理的普及同样带来新的风险。今年早些时候，Perplexity 推出集成 AI 代理的浏览器 Comet。这类代理可像真人用户一样访问站点，并在邮箱、网银与企业系统等已登录会话中执行操作。高权限意味着一旦网页中埋有恶意指令，就可能诱使代理做出不当行为，比如把敏感数据发送到外部地址。

在进一步分析安全问题时，Perplexity 发现现有评测基准如 AgentDojo 难以覆盖复杂的网页攻防场景。它们多依赖简单提示，无法还原真实网页的复杂内容，使攻击者更容易将恶意逻辑隐藏起来。

为解决这一问题，Perplexity 搭建了 BrowseSafe Bench，从三大维度定义网页攻击版图：攻击类型、注入手法与语言风格。该基准尤其关注“难以察觉的内容”，也就是那些看似正常却可能被误判或漏判的复杂材料。借助专家混合架构，BrowseSafe 能在不影响使用体验的前提下并行完成安全扫描。

评估同时也暴露出一些挑战。例如，针对多语言攻击的识别率下降至 76%。另外，把恶意内容藏在 HTML 注释中的情况，比把内容放在显性区域（如页面底部）更容易被检测到。Perplexity 以三层防线应对：先用快速分类器拦截，再结合具备推理能力的前沿大语言模型，形成完整的保护机制。

尽管 BrowseSafe 整体表现优秀，仍有近 10% 的攻击能绕过防御，这也反映出网络环境复杂多变、攻击方式不断进化。对此，Perplexity 已开放其基准、模型与研究论文，希望帮助业界提升 AI 代理的网页交互安全。