能力与安全如何取舍？OpenAI 推出 ChatGPT“封锁模式”，宁可限制联网也要降低泄密风险-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

随着生成式人工智能加速迈向智能体（Agent）时代，模型的工具调用能力和联网能力不断增强，也让安全防护面临越来越大的挑战。为应对愈发常见的提示注入攻击，OpenAI 近日正式上线了一项颇具针对性的可选安全设置——“封锁模式”（Lockdown Mode）。目前，这项功能已向所有已登录用户开放，覆盖不同账号类型和各类工作区。

提示注入攻击，一直是大模型团队重点防范的安全问题。攻击者通常会把恶意指令隐藏在网页、第三方文档或其他外部数据里。一旦 ChatGPT 在联网状态下读取到这些被植入内容的数据，就可能被诱导无视原本的核心安全规则，进而执行超出授权的操作，甚至在用户不知情的情况下，把商业机密、个人隐私等敏感信息偷偷传送到外部恶意服务器。

针对这一行业普遍存在的难题，OpenAI这次推出的封锁模式，在设计思路上显得相当直接。它并没有试图完全识别所有不断变化的恶意指令，而是选择先限制最关键、风险最高的一步——阻断向外部发起网络请求的能力。

当用户或工作区管理员开启封锁模式后，ChatGPT 多项核心能力都会受到明显限制。比如实时网页浏览功能会被大幅收紧，系统只能访问受保护的缓存网页内容，因此搜索结果可能不够完整，也可能已经过期，甚至无法正常使用。同时，模型不会在回复中抓取和展示来自外部网络的图片，也不能从网上下载文件用于高级数据分析。

除此之外，被视作高阶效率工具的“深度研究（Deep Research）”和“智能体模式（Agent Mode）”也会被直接停用。即便是在 Canvas 画布中生成的代码，也无法再获得联网访问权限。在这种模式下，模型能够处理的文件范围，仅限于用户手动上传的本地安全文件。

不过，OpenAI也在官方帮助文档中明确说明，封锁模式并不是万能的安全方案，无法保证提示注入攻击被百分之百彻底消除。原因在于，恶意指令仍可能藏在合法的缓存网页中，或潜伏在用户自己上传的文件里，继续对模型判断造成干扰。

这项新功能的推出，也很直观地说明了当前 AI 行业面临的一个现实问题：模型开放的联网权限越多、自动化工具调用越深入，对外暴露的攻击面往往也越大。封锁模式的出现，本质上就是 OpenAI 为 AI 能力主动划出的一道安全边界。它没有承诺“绝对安全”，而是把“更强、更智能的协同体验”与“更低的数据泄露风险”之间的取舍，重新交给用户和企业管理员自己决定。