OpenAI 以攻为守：让 AI 扮演黑客，修补代理式浏览器的高危漏洞-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

OpenAI 正在尝试一套“以攻促防”的新方法，强化其代理型网页浏览器 ChatGPT Atlas 的防护。为应对越来越复杂的网络风险，OpenAI 搭建了一种“自动化攻击者”体系，全天候用接近真实黑客的打法对 Atlas 施压与演练。

该体系的重点是抵御提示注入（Prompt Injection）攻击。这类攻击中，外部的恶意方会暗中向 AI 代理植入指令，诱使其做出违背用户意图的行为，比如在用户不知情时转发敏感邮件、或删除云端资料。据 AIbase 了解，OpenAI 的这套“自动化攻击者”借助先进的强化学习方法，能自主挖掘出人类红队未能发现的全新攻击路径。

在一场实际演示里，这名 AI 攻击者曾成功复现诱导 Atlas 给公司 CEO 发送辞职信的情景。尽管 Atlas 的安全机制最终阻断了该请求并向用户发出提醒，OpenAI 也直言，安全对抗将是一场长期拉锯。由于代理式浏览器需要深度接入用户的数字生活（如访问邮件、日历等），其便捷性同时也扩大了风险暴露面。

即便防护技术持续迭代，OpenAI 在最新报告中也强调，受限于 AI 代理的内在属性，这类威胁恐怕难以被彻底“根除”。AIbase 提醒用户，在享受 AI 浏览器带来便利的同时，仍要保持警觉，关注官方发布的实时安全通报与防护指引。