能力与安全如何取舍?OpenAI 推出 ChatGPT“封锁模式”,宁可限制联网也要降低泄密风险

随着生成式人工智能加速迈向智能体(Agent)时代,模型的工具调用能力和联网能力不断增强,也让安全防护面临越来越大的挑战。为应对愈发常见的提示注入攻击,OpenAI 近日正式上线了一项颇具针对性的可选安全设置——“封锁模式”(Lockdown Mode)。目前,这项功能已向所有已登录用户开放,覆盖不同账号类型和各类工作区。

提示注入攻击,一直是大模型团队重点防范的安全问题。攻击者通常会把恶意指令隐藏在网页、第三方文档或其他外部数据里。一旦 ChatGPT 在联网状态下读取到这些被植入内容的数据,就可能被诱导无视原本的核心安全规则,进而执行超出授权的操作,甚至在用户不知情的情况下,把商业机密、个人隐私等敏感信息偷偷传送到外部恶意服务器。

针对这一行业普遍存在的难题,OpenAI这次推出的封锁模式,在设计思路上显得相当直接。它并没有试图完全识别所有不断变化的恶意指令,而是选择先限制最关键、风险最高的一步——阻断向外部发起网络请求的能力。

当用户或工作区管理员开启封锁模式后,ChatGPT 多项核心能力都会受到明显限制。比如实时网页浏览功能会被大幅收紧,系统只能访问受保护的缓存网页内容,因此搜索结果可能不够完整,也可能已经过期,甚至无法正常使用。同时,模型不会在回复中抓取和展示来自外部网络的图片,也不能从网上下载文件用于高级数据分析。

除此之外,被视作高阶效率工具的“深度研究(Deep Research)”和“智能体模式(Agent Mode)”也会被直接停用。即便是在 Canvas 画布中生成的代码,也无法再获得联网访问权限。在这种模式下,模型能够处理的文件范围,仅限于用户手动上传的本地安全文件。

不过,OpenAI也在官方帮助文档中明确说明,封锁模式并不是万能的安全方案,无法保证提示注入攻击被百分之百彻底消除。原因在于,恶意指令仍可能藏在合法的缓存网页中,或潜伏在用户自己上传的文件里,继续对模型判断造成干扰。

这项新功能的推出,也很直观地说明了当前 AI 行业面临的一个现实问题:模型开放的联网权限越多、自动化工具调用越深入,对外暴露的攻击面往往也越大。封锁模式的出现,本质上就是 OpenAI 为 AI 能力主动划出的一道安全边界。它没有承诺“绝对安全”,而是把“更强、更智能的协同体验”与“更低的数据泄露风险”之间的取舍,重新交给用户和企业管理员自己决定。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享