OpenAI今日发布了迄今最先进的智能体编程模型——GPT-5.2-Codex,宣告AI在软件工程落地能力进入新阶段。它面向复杂、周期长的真实开发任务打造,不但在权威基准测试中创下新高,还首次打通从读懂代码、搭建环境,到漏洞挖掘与Pull Request提交的全流程自动化。

GPT-5.2-Codex并非一次小幅升级,而是深度融合了GPT-5.2的通用推理能力与GPT-5.1-Codex-Max的终端操作能力,并引入革新的“上下文压缩”技术——在代码重构、跨库迁移等需要超长上下文的任务上,速度与准确率都有明显提升。
围绕开发者的真实工作流,模型进一步提升了在Windows 10/11原生环境下的执行稳定性,摆脱过去偏向Linux的限制。更值得关注的是视觉理解的大幅增强:只要上传UI截图、技术图表或手绘草图,Codex就能准确还原设计意图,自动生成结构清晰、可运行的前端或全栈原型代码,大大缩短从设计到上线的周期。

在权威评测中,GPT-5.2-Codex在SWE-Bench Pro(软件工程修复)与Terminal-Bench 2.0(终端操作)上均刷新成绩,工具调用成功率与事实一致性明显优于前代。现在,它可以独立完成:
– 读懂并穿梭大型代码库
– 自动生成测试用例
– 运行模糊测试(Fuzzing)
– 产出安全修复补丁
– 生成完整的GitHub Pull Request
其落地价值已在安全领域得到验证。OpenAI披露,安全公司Privy的首席工程师Andrew MacPherson曾借助上一代Codex模型,成功复现并深入挖掘React Server Components中的三处未知漏洞。智能体全程协助搭建环境、分析攻击面、执行自动化测试,把漏洞验证从几天压缩到数小时。

考虑到强大能力可能带来的“双重用途”风险,OpenAI选择稳妥推进:虽未将其划为“高风险”模型,但已内置多层安全防护。同时,公司启动“可信访问试点计划”(Trusted Access Pilot),仅向通过严格审核的安全研究者与关键基础设施团队开放高权限版本,用于受控环境中的攻防演练与威胁模拟。
目前,所有ChatGPT付费用户已可直接体验GPT-5.2-Codex,API访问会在未来数周逐步放开。当AI不仅能写代码,还能理解业务、修复漏洞、协同开发,工程师的角色正从“编码者”转向“AI指挥官”——而GPT-5.2-Codex,正是这场范式变革的最强助推器。


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?