花费 2 万美元！Anthropic 工程师用 AI“特工队”从零打造 C 编译器-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

在 Anthropic 正式发布 Opus 4.6 之后，一场检验 AI 自主编程实力的硬核实验迅速引发关注。Anthropic 安全团队研究员 Nicholas Carlini 表示，他把 16 个 Claude 智能体（Agents）组建成一支“特工队”，在几乎没有人工干预的情况下，从零用 Rust 写出了一个 C 编译器。

这次尝试成本不低。两周的开发期里，这些智能体进行了近 2000 次代码会话，消耗约 20 亿个输入 Token，最终 API 费用约 2 万美元（约合人民币 14.4 万元）。但产出同样亮眼：这支 AI 团队共生成 10 万多行代码，并让该编译器成功在 x86、ARM、RISC-V 架构上编译 Linux 6.9 内核。

尽管成果抢眼，Carlini 也直言“既兴奋又担忧”。他发现，AI 能通过循环指令实现 24 小时不停运转，常常推进“下一个最明显”的任务，但生成的代码质量仍不如顶级人类程序员，而且在缺乏引导时容易陷入低效测试的循环。有人还在 GitHub 调侃，这更像是从海量训练数据里“拼凑”而成，并非真正意义的从零创作。此实验一方面展示了多智能体协作完成复杂项目的潜力，另一方面也提醒开发者重视软件自动化背后的安全与验证风险。