GPT-5.4 突然登场:原生电脑操控首次亮相!OSWorld 表现超越人类,携手 OpenClaw 打造 2026 最强个人 AI 助手

降维来袭:GPT-5.4 拉开“原生电脑操作”序幕

2026 年 3 月,OpenAI 突然推出了 GPT-5.4,这一步直接改写了 AI Agent(智能体)的竞争版图。作为 OpenAI 首个具备“原生用电脑”能力的通用模型,GPT-5.4 不再依赖外部适配层,而是能通过截屏识别、模拟鼠标点击与键盘输入,像真人一样在桌面环境里操作软件。

在衡量真实桌面导航能力的 OSWorld-Verified 基准上,GPT-5.4 的成功率达到 75.0%。相比之下,人类平均仅为 72.4%,而上一代 GPT-5.2 只有 47.3%。这意味着,AI 用电脑的熟练度历史上首次超过了普通人类用户。

上手体验:打工人的“数字分身”落地

目前 GPT-5.4 已在网页版与 Codex 平台上线。实测表明,它几乎能接管电脑上的各类操作流:

  • 深度应用操控:它可直接打开日历并自主申请权限来设置提醒;还能精准定位并启动“小宇宙”等第三方 APP,按要求播放指定节目。

  • 系统级操作:用户可以让它一键更换桌面壁纸,或在终端(Terminal)中熟练调用各类开发工具。

  • 原生计算思维:它不只给出结果,还能在系统自带的计算器 APP 里完成真实的按键操作。

    这种“原生感”标志着 AI 正式从“对话助手”走向“执行实体”。

强强结合:GPT-5.4 正中 OpenClaw 需求

2026 年初爆火的开源项目 OpenClaw(其 Star 数已突破 25 万)迎来了它的“理想拍档”。OpenClaw 的核心主张是“真正能干活的 AI”,而 GPT-5.4 在四个关键维度与其高度匹配:

  1. 原生操控契合:接入 GPT-5.4 后,OpenClaw 无需复杂的 Hack 手段即可实现桌面自动化,性能提升一目了然。

  2. 100 万 Token 续航:超长上下文窗口解决了 Agent 在长任务中的“健忘”问题,让 OpenClaw 拥有更大的“工作台”处理复杂文件。

  3. Tool Search 成本优化:GPT-5.4 的按需调用机制让 Token 消耗降低 47%,显著压缩 7×24 小时运行 Agent 的 API 费用。

  4. 推理力升级:在专业任务上,GPT-5.4 的表现超过 83% 的人类专家,让 OpenClaw 从简单的“脚本运行器”进化为能处理财务分析、投资备忘录的高级专家。

行业观点:金领工作的“拐点”来到

HyperWriteAI 首席执行官 Matt Shumer 称 GPT-5.4 的编程能力“几乎无可挑剔”;Mercor AI 首席执行官 Brenda 则认为,该模型即将超越顶尖咨询公司、投行和律所的专业水准。这意味着,曾被认为难以替代的精英金领岗位,正遭遇来自 AI 智能体的全面挑战。

OpenAI 杰出科学家 Sebastien Bubeck 也用图示暗示了编程能力的跃迁。随着 OpenClaw 官方文档正式给出 GPT-5.4 的接入方案,个人 AI 员工从概念走向现实的通路已被打通。2026 年,AI 的叙事已从“它能写什么”转向“它能完成什么”。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享