OpenAI 首席执行官 Sam Altman 宣布发布新一代编程大模型

在性能方面,GPT-5.3-Codex 在多项权威测评中创造新高:其在 SWE-Bench Pro 编程评测中拿到 57%,而在更注重系统实操的 TerminalBench2.0 与 OSWorld 测试中,分别取得 76% 与 64% 的成绩。这说明它不仅会写代码,还具备出色的计算机实际操作能力,能像人类工程师一样理解并完成复杂的操作系统任务。
在运行效率上也有显著提升。OpenAI 表示,在同等难度任务下,GPT-5.3-Codex 的令牌(Token)消耗较 5.2 版本减少逾一半,同时单令牌处理速度提升超过 25%。这种“更快、更省”的特性,将明显降低企业与开发者集成 AI 编程能力的成本。此外,模型支持任务执行过程中的实时调控与动态更新,极大增强了开发流程的灵活度。
安全层面,GPT-5.3-Codex 是 OpenAI 首款在安全防护框架的网络安全维度获评“高等级”的模型。为进一步强化防御体系,OpenAI 同步推出可信访问框架试点计划,并投入 1000 万美元 API 额度,旨在以 AI 加速全球网络安全防御建设。
划重点:
-
💻 编程与实操双进化:在 SWE-Bench Pro 等多项测评上表现突出,具备成熟的计算机系统自主操作与复杂编程能力。
-
⚡ 运行效率大幅跃升:相较 5.2 版本,同类任务令牌消耗下降超 50%,处理速度提升超 25%,显著提升任务执行的成本效益。
-
🛡️ 安全防御等级登顶:网络安全维度获“高等级”评价,OpenAI 拨付千万美元额度专项支持网络安全体系建设。


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?