OpenAI面向用户发布全新基础模型GPT-5.4,目标是打造当前功能更强、效率更高的专业级工作模型。据 相关报道,此次采取差异化发布策略,除标准版外,还同步推出专注复杂逻辑推理的 GPT-5.4Thinking,以及面向高性能需求优化的 GPT-5.4Pro。

技术方面,GPT-5.4 的 API 版本迎来大幅升级,提供高达 100 万个标记(Tokens)的上下文窗口,为 OpenAI 迄今最大。同时,模型显著优化了令牌使用效率,用更少资源即可处理同类任务。
在安全与准确性上,新版本相较 GPT-5.2 的单条陈述错误率下降 33%,整体回复错误率降低 18%。此外,针对推理模型可能存在的“思维链欺骗”风险,OpenAI 引入全新安全评估机制。测试显示,GPT-5.4Thinking透明度更高,更难隐藏或伪造其推理过程。
在多项实测基准中,GPT-5.4表现亮眼,不仅在 OSWorld-Verified 与 WebArena Verified 等计算机使用测试中刷新成绩,还在知识工作任务 GDPval 测试中拿下 83% 的纪录级分数。
Mercor 首席执行官 Brendan Foody 表示,该模型在金融、法律等专业场景的APEX-Agents基准中同样领先,尤其擅长产出财务模型、法律分析等可长期沉淀的成果。配合全新的“工具搜索”系统,模型在调用外部工具时更高效,大幅减少在大规模工具集成下的令牌消耗。
用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?