在 Anthropic 正式发布 Opus 4.6 之后,一场检验 AI 自主编程实力的硬核实验迅速引发关注。Anthropic 安全团队研究员 Nicholas Carlini 表示,他把 16 个 Claude 智能体(Agents)组建成一支“特工队”,在几乎没有人工干预的情况下,从零用 Rust 写出了一个 C 编译器。
这次尝试成本不低。两周的开发期里,这些智能体进行了近 2000 次代码会话,消耗约 20 亿个输入 Token,最终 API 费用约 2 万美元(约合人民币 14.4 万元)。但产出同样亮眼:这支 AI 团队共生成 10 万多行代码,并让该编译器成功在 x86、ARM、RISC-V 架构上编译 Linux 6.9 内核。
尽管成果抢眼,Carlini 也直言“既兴奋又担忧”。他发现,AI 能通过循环指令实现 24 小时不停运转,常常推进“下一个最明显”的任务,但生成的代码质量仍不如顶级人类程序员,而且在缺乏引导时容易陷入低效测试的循环。有人还在 GitHub 调侃,这更像是从海量训练数据里“拼凑”而成,并非真正意义的从零创作。此实验一方面展示了多智能体协作完成复杂项目的潜力,另一方面也提醒开发者重视软件自动化背后的安全与验证风险。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?