DeepSeek“企鹅家族”午夜曝出：Emperor 512 预算对标 GPT-5.2，零推理 Mumble 追求极致秒回-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

12月4日凌晨，GitHub 与 DesignArena 同步传出 OpenAI 内部代号“企鹅”（Penguin）的全新模型阵列，四档推理预算首次公开：高端 Emperor512、中端 Rockhopper64、轻量 Macaroni16 与零推理 Mumble0，覆盖云到边缘的全场景。

大模型元宇宙 (1)

图源说明：图片由 AI 生成，授权方为 Midjourney

512 推理预算！Emperor 或将成为 GPT-5.2 的核心

内部资料显示，Emperor 拥有 512 单位“juice”推理预算，是现有主力模型的 8-10 倍，端到端延迟仍压到 80ms 内，带来几乎“零等待”的交流体验；其代码路径加入了实时剪枝与动态算力分配，疑似作为明年 GPT-5.2 的底层架构候选。

四档预算 = 四种延迟：Macaroni 主打高速，Mumble 直接取消推理

– Rockhopper（64）（中端）走“推理与速度”平衡路线，目标替换 GPT-4.5

– Macaroni（16）面向移动场景，首次在 8 Gen 3 芯片上跑通 70B 模型

– Mumble（0）完全跳过推理流程，响应<50ms，适用于高频自动补全与语音打断场景

记忆搜索一并曝光：一键找回对话上下文

同批代码还显示，ChatGPT 将加入“Memory Search”按钮，用户用自然语言即可即时检索历史记忆，无需手动翻找聊天记录；该功能已处于内测阶段，预计与企鹅家族模型同步上线。

Shallotpeat 与 Garlic 接踵而来：OpenAI 进入紧急冲刺

The Information 称，OpenAI 或于下周发布内部代号 Shallotpeat 的新推理模型，其性能已领先 Gemini 3；另一款 Garlic 已完成预训练，计划在 2026 年初以 GPT-5.2/5.5 形态推出，走“小参数 + 高密度知识”路线，正面对标谷歌的“预训练飞跃”。

行业震动：开源与闭源双线提速

– 对开发者而言，四档预算意味着同一接口可选“延迟-成本-精度”不同组合，API 价格有望下调约 30%

– 对竞品而言，OpenAI 首次把“推理预算”明码标注，或促使 Google、Anthropic 跟进类似分层

– 对监管而言，零推理的 Mumble 虽极快，但可能提高错误率，安全评估或成发布前的关键环节

OpenAI 尚未公布企鹅家族的具体上线时间，目前已在 DesignArena 展开盲测，胜出的模型将直接进入 ChatGPT Plus 与 Enterprise 通道。后续将持续关注，第一时间更新基准测试与 API 定价信息。