OpenAI推出GPT-5.2-Codex:最强智能体编程模型亮相,可自主挖洞并提交PR

OpenAI今日发布其目前最先进的智能体编程模型——GPT-5.2-Codex,宣告AI在软件工程实战能力上迈入新阶段。该模型面向复杂、周期长的真实开发任务打造,不仅在权威基准上创下新高,还首次把从代码理解、环境搭建到漏洞挖掘与Pull Request提交的完整流程实现全自动。

image.png

这并非一次小修小补。GPT-5.2-Codex深度融合了GPT-5.2的通用推理力与GPT-5.1-Codex-Max的终端操控力,并引入“上下文压缩”这一革新技术——在代码重构、跨库迁移等依赖超长上下文的任务中,效率与准确率明显提升。

围绕开发者的真实工作流,模型在Windows 10/11原生环境中的执行稳定性显著增强,摆脱过去偏向Linux的局限。更值得关注的是视觉理解能力的大幅进步:只需上传UI截图、技术图表或手绘草图,Codex即可精准读懂设计意图,并自动产出结构清晰、可运行的前端或全栈原型代码,大幅缩短从设计到上线的周期。

image.png

权威评测中,GPT-5.2-Codex在SWE-Bench Pro(软件工程修复)与Terminal-Bench 2.0(终端操作)上双双刷新成绩,工具调用成功率与事实一致性均明显优于前代。如今,它可独立完成:  

– 穿梭并理解大型代码库  

– 自动生成测试用例  

– 开展模糊测试(Fuzzing)  

– 产出安全修复补丁  

– 构建并提交完整的GitHub Pull Request  

其实战价值已在安全领域得到验证。OpenAI披露,安全公司Privy的首席工程师Andrew MacPherson曾借助上一代Codex模型,成功复现并深入挖掘React Server Components中的三个未知漏洞。AI智能体全程协助环境搭建、推演攻击面、执行自动化测试,将漏洞验证从数天压缩到数小时。

image.png

考虑到强大能力可能带来的“双重用途”风险,OpenAI选择稳妥推进:虽未将其划为“高风险”模型,但已内置多重防护;同时启动“可信访问试点计划”(Trusted Access Pilot),仅向经严格审核的安全研究者与关键信息基础设施团队开放高权限版本,用于受控环境的攻防演练与威胁模拟。

目前,所有ChatGPT付费用户已可直接使用GPT-5.2-Codex,API将于未来数周逐步开放。当AI不止能写代码,还能理解业务、修补漏洞、协同开发,程序员的角色正从“编码者”转向“AI指挥官”——而GPT-5.2-Codex,正是这场转变的最强助推器。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享