OpenAI 正采用一种“以攻治攻”的新思路,提升其代理式网页浏览器 ChatGPT Atlas 的安全能力。为应对愈发复杂的网络威胁,OpenAI 打造了一套“自动化攻击者”系统,借助模拟真实黑客的招数,对 ChatGPT Atlas 开展 7×24 小时的压力测试。
这套系统的重点是防御提示注入(Prompt Injection)攻击。这类攻击会在第三方内容中暗藏指令,诱导 AI 代理做出违背用户意愿的操作,比如在用户不知情时转发敏感邮件,或删除云端文件。据称,OpenAI 的“自动化攻击者”结合了先进的强化学习方法,能够自主挖掘出人类红队未曾发现的新型攻击路径。
在一次真实演示中,这个 AI 攻击者曾成功构造场景,诱使 Atlas 向公司 CEO 发送辞职信。尽管 Atlas 的防护机制最终拦截了该请求并提醒了用户,OpenAI 也直言,安全对抗是一场长期的较量。由于代理式浏览器需要深度接入用户的数字生活(如访问邮件、日历等),带来便利的同时也让风险面更大。
即便技术不断进步,OpenAI 在最新报告中仍警示:受限于 AI 代理的内在特性,这类安全威胁恐怕难以被完全“根治”。因此,建议用户在享受 AI 浏览器带来效率的同时,保持警惕,及时关注官方发布的安全响应与防护建议。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?