OpenAI 正在尝试一套“以攻促防”的新方法,强化其代理型网页浏览器 ChatGPT Atlas 的防护。为应对越来越复杂的网络风险,OpenAI 搭建了一种“自动化攻击者”体系,全天候用接近真实黑客的打法对 Atlas 施压与演练。
该体系的重点是抵御提示注入(Prompt Injection)攻击。这类攻击中,外部的恶意方会暗中向 AI 代理植入指令,诱使其做出违背用户意图的行为,比如在用户不知情时转发敏感邮件、或删除云端资料。据 AIbase 了解,OpenAI 的这套“自动化攻击者”借助先进的强化学习方法,能自主挖掘出人类红队未能发现的全新攻击路径。
在一场实际演示里,这名 AI 攻击者曾成功复现诱导 Atlas 给公司 CEO 发送辞职信的情景。尽管 Atlas 的安全机制最终阻断了该请求并向用户发出提醒,OpenAI 也直言,安全对抗将是一场长期拉锯。由于代理式浏览器需要深度接入用户的数字生活(如访问邮件、日历等),其便捷性同时也扩大了风险暴露面。
即便防护技术持续迭代,OpenAI 在最新报告中也强调,受限于 AI 代理的内在属性,这类威胁恐怕难以被彻底“根除”。AIbase 提醒用户,在享受 AI 浏览器带来便利的同时,仍要保持警觉,关注官方发布的实时安全通报与防护指引。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?