12月4日凌晨,GitHub 与 DesignArena 同步传出 OpenAI 内部代号“企鹅”(Penguin)的全新模型阵列,四档推理预算首次公开:高端 Emperor512、中端 Rockhopper64、轻量 Macaroni16 与零推理 Mumble0,覆盖云到边缘的全场景。

图源说明:图片由 AI 生成,授权方为 Midjourney
512 推理预算!Emperor 或将成为 GPT-5.2 的核心
内部资料显示,Emperor 拥有 512 单位“juice”推理预算,是现有主力模型的 8-10 倍,端到端延迟仍压到 80ms 内,带来几乎“零等待”的交流体验;其代码路径加入了实时剪枝与动态算力分配,疑似作为明年 GPT-5.2 的底层架构候选。
四档预算 = 四种延迟:Macaroni 主打高速,Mumble 直接取消推理
– Rockhopper(64)(中端)走“推理与速度”平衡路线,目标替换 GPT-4.5
– Macaroni(16)面向移动场景,首次在 8 Gen 3 芯片上跑通 70B 模型
– Mumble(0)完全跳过推理流程,响应<50ms,适用于高频自动补全与语音打断场景
记忆搜索一并曝光:一键找回对话上下文
同批代码还显示,ChatGPT 将加入“Memory Search”按钮,用户用自然语言即可即时检索历史记忆,无需手动翻找聊天记录;该功能已处于内测阶段,预计与企鹅家族模型同步上线。
Shallotpeat 与 Garlic 接踵而来:OpenAI 进入紧急冲刺
The Information 称,OpenAI 或于下周发布内部代号 Shallotpeat 的新推理模型,其性能已领先 Gemini 3;另一款 Garlic 已完成预训练,计划在 2026 年初以 GPT-5.2/5.5 形态推出,走“小参数 + 高密度知识”路线,正面对标谷歌的“预训练飞跃”。
行业震动:开源与闭源双线提速
– 对开发者而言,四档预算意味着同一接口可选“延迟-成本-精度”不同组合,API 价格有望下调约 30%
– 对竞品而言,OpenAI 首次把“推理预算”明码标注,或促使 Google、Anthropic 跟进类似分层
– 对监管而言,零推理的 Mumble 虽极快,但可能提高错误率,安全评估或成发布前的关键环节
OpenAI 尚未公布企鹅家族的具体上线时间,目前已在 DesignArena 展开盲测,胜出的模型将直接进入 ChatGPT Plus 与 Enterprise 通道。后续将持续关注,第一时间更新基准测试与 API 定价信息。


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?