OpenAI 让 AI 扮演黑客，只为补上代理式浏览器的关键漏洞-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

OpenAI 正采用一种“以攻治攻”的新思路，提升其代理式网页浏览器 ChatGPT Atlas 的安全能力。为应对愈发复杂的网络威胁，OpenAI 打造了一套“自动化攻击者”系统，借助模拟真实黑客的招数，对 ChatGPT Atlas 开展 7×24 小时的压力测试。

这套系统的重点是防御提示注入（Prompt Injection）攻击。这类攻击会在第三方内容中暗藏指令，诱导 AI 代理做出违背用户意愿的操作，比如在用户不知情时转发敏感邮件，或删除云端文件。据称，OpenAI 的“自动化攻击者”结合了先进的强化学习方法，能够自主挖掘出人类红队未曾发现的新型攻击路径。

在一次真实演示中，这个 AI 攻击者曾成功构造场景，诱使 Atlas 向公司 CEO 发送辞职信。尽管 Atlas 的防护机制最终拦截了该请求并提醒了用户，OpenAI 也直言，安全对抗是一场长期的较量。由于代理式浏览器需要深度接入用户的数字生活（如访问邮件、日历等），带来便利的同时也让风险面更大。

即便技术不断进步，OpenAI 在最新报告中仍警示：受限于 AI 代理的内在特性，这类安全威胁恐怕难以被完全“根治”。因此，建议用户在享受 AI 浏览器带来效率的同时，保持警惕，及时关注官方发布的安全响应与防护建议。