在 AI 圈里,一次打包疏漏引发的“蝴蝶效应”,正演变成一场技术界的顶级公开课。
据媒体称,因 Bun 构建工具配置失误,Anthropic 旗下编程智能体
五层架构全景:它远不只是个“套壳”界面
泄露代码展示了一个生产级且复杂的系统,清晰分为五层:
入口层(Entrypoints): 将 CLI、桌面端与 SDK 汇入统一路由,做多端输入的标准化。
运行层(Runtime): 以 TAOR 循环(Think-Act-Observe-Repeat)为核心,维持 Agent 的行动节奏。
引擎层(Engine): 作为系统中枢,负责动态拼装提示。按不同模式注入上百个提示片段,仅安全规则就高达 5,677 个 token。
工具与能力层(Tools & Caps): 内建约 40 个独立工具,并对每个工具进行严格的权限隔离。
基础设施层(Infrastructure): 负责提示缓存与远程管控,甚至包含可远程停用的“杀开关”。
仿生式设计:分层记忆与“REM 睡眠”机制
三层记忆: 分为长期语义记忆(RAG 检索)、情景记忆(对话序列)和工作记忆(当前上下文),核心原则是“按需取用,不盲目塞满”。
Auto-Dream 机制: 基础设施层内置一个名为“做梦”的后台进程。每 24 小时或 5 次会话后,系统会启动子代理整合记忆、清理噪声,把模糊表述沉淀为可用知识。
信息控制三件套:卧底模式与反蒸馏
源码中露出的“防线”体现了 Anthropic 对信息控制的严谨思维:
Undercover 模式: 在非内部仓库操作时自动触发,去除所有 AI 标识,进行“隐身贡献”。
反蒸馏机制(ANTI_DISTILLATION): 开启后向提示中注入虚假工具定义,避免对手用 API 流量反向训练自家模型。
原生认证: 基于 Bun/Zig 层的硬件级认证,阻止第三方篡改或伪造官方客户端。
未来路线图:KAIROS 与“永不打烊”的助手
泄露的 Feature Flag 暗示下一代能力:KAIROS 模式。这是一种常驻后台运行的代理,支持 GitHub Webhook 订阅与 Cron 定时任务。这意味着 AI 将从“用时再唤醒”的工具,进化为 24 小时在线、能自主观察并主动行动的协作伙伴。
结语:代码外泄,难以复制的是积累
尽管 Anthropic 已紧急下线相关版本并发出 DMCA 通知,但

















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?