GPT-5.2横扫“AI造浏览器”挑战,长程编程稳压Claude Opus4.5

当AI尝试从零打造一款完整的Web浏览器——从HTML解析、CSS排版,到自研JavaScript虚拟机——考验的不只是会不会写代码,更是对逻辑一致性、长期执行力和工程理解力的极限挑战。

近日,知名AI编程工具Cursor公布了一项震撼业内的内部评测:OpenAI最新模型GPT-5.2在超长周期、高复杂度的自主编程任务中,明显领先Anthropic的Claude Opus4.5,展现出前所未有的工程级稳定性。

这次实验并非简单拼装代码,而是要求模型在数周内持续推进一个涉及数百万行代码的系统工程。期间,AI需要反复理解上下文、修补早期设计问题、协调模块依赖,并始终围绕最终目标前进。测试结果显示,GPT-5.2能够稳定执行复杂指令链,在长时推理中几乎不出现“目标漂移”。相较之下,Claude Opus4.5在短问答和单文件编码上表现亮眼,但面对这类“马拉松式”开发时,更易提前收尾、选择简化路线,或把控制权交还给人类。

这一差异揭示了当下大模型在“自主代理”能力上的关键分水岭:能否在少干预甚至无干预情况下,像人类工程团队一样持续推进大型项目。Cursor团队表示,GPT-5.2不仅完成了浏览器构建,还成功复现了Windows7模拟器,并主导了超百万行代码的遗留系统迁移——这些过去往往需要数月人力的工作,正被AI以惊人的连贯度逐步接手。

目前,GPT-5.2已接入Cursor平台,开发者可直接调用其能力开展高阶编程协作。此举不仅显著提升个人开发效率,也预示着一种新范式:未来,AI或将以“数字工程师”的身份独立承担端到端的软件工程。从架构规划、系统调试到持续优化,软件开发的边界正被重新定义。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享