OpenAI 以攻为守:让 AI 扮演黑客,修补代理式浏览器的高危漏洞

OpenAI 正在尝试一套“以攻促防”的新方法,强化其代理型网页浏览器 ChatGPT Atlas 的防护。为应对越来越复杂的网络风险,OpenAI 搭建了一种“自动化攻击者”体系,全天候用接近真实黑客的打法对 Atlas 施压与演练。

该体系的重点是抵御提示注入(Prompt Injection)攻击。这类攻击中,外部的恶意方会暗中向 AI 代理植入指令,诱使其做出违背用户意图的行为,比如在用户不知情时转发敏感邮件、或删除云端资料。据 AIbase 了解,OpenAI 的这套“自动化攻击者”借助先进的强化学习方法,能自主挖掘出人类红队未能发现的全新攻击路径。

在一场实际演示里,这名 AI 攻击者曾成功复现诱导 Atlas 给公司 CEO 发送辞职信的情景。尽管 Atlas 的安全机制最终阻断了该请求并向用户发出提醒,OpenAI 也直言,安全对抗将是一场长期拉锯。由于代理式浏览器需要深度接入用户的数字生活(如访问邮件、日历等),其便捷性同时也扩大了风险暴露面。

即便防护技术持续迭代,OpenAI 在最新报告中也强调,受限于 AI 代理的内在属性,这类威胁恐怕难以被彻底“根除”。AIbase 提醒用户,在享受 AI 浏览器带来便利的同时,仍要保持警觉,关注官方发布的实时安全通报与防护指引。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享