DeepSeek“企鹅家族”午夜曝出:Emperor 512 预算对标 GPT-5.2,零推理 Mumble 追求极致秒回

12月4日凌晨,GitHub 与 DesignArena 同步传出 OpenAI 内部代号“企鹅”(Penguin)的全新模型阵列,四档推理预算首次公开:高端 Emperor512、中端 Rockhopper64、轻量 Macaroni16 与零推理 Mumble0,覆盖云到边缘的全场景。

大模型 元宇宙 (1)

图源说明:图片由 AI 生成,授权方为 Midjourney

512 推理预算!Emperor 或将成为 GPT-5.2 的核心

内部资料显示,Emperor 拥有 512 单位“juice”推理预算,是现有主力模型的 8-10 倍,端到端延迟仍压到 80ms 内,带来几乎“零等待”的交流体验;其代码路径加入了实时剪枝与动态算力分配,疑似作为明年 GPT-5.2 的底层架构候选。

四档预算 = 四种延迟:Macaroni 主打高速,Mumble 直接取消推理

– Rockhopper(64)(中端)走“推理与速度”平衡路线,目标替换 GPT-4.5

– Macaroni(16)面向移动场景,首次在 8 Gen 3 芯片上跑通 70B 模型

– Mumble(0)完全跳过推理流程,响应<50ms,适用于高频自动补全与语音打断场景

记忆搜索一并曝光:一键找回对话上下文

同批代码还显示,ChatGPT 将加入“Memory Search”按钮,用户用自然语言即可即时检索历史记忆,无需手动翻找聊天记录;该功能已处于内测阶段,预计与企鹅家族模型同步上线。

Shallotpeat 与 Garlic 接踵而来:OpenAI 进入紧急冲刺

The Information 称,OpenAI 或于下周发布内部代号 Shallotpeat 的新推理模型,其性能已领先 Gemini 3;另一款 Garlic 已完成预训练,计划在 2026 年初以 GPT-5.2/5.5 形态推出,走“小参数 + 高密度知识”路线,正面对标谷歌的“预训练飞跃”。

行业震动:开源与闭源双线提速

– 对开发者而言,四档预算意味着同一接口可选“延迟-成本-精度”不同组合,API 价格有望下调约 30%

– 对竞品而言,OpenAI 首次把“推理预算”明码标注,或促使 Google、Anthropic 跟进类似分层

– 对监管而言,零推理的 Mumble 虽极快,但可能提高错误率,安全评估或成发布前的关键环节

OpenAI 尚未公布企鹅家族的具体上线时间,目前已在 DesignArena 展开盲测,胜出的模型将直接进入 ChatGPT Plus 与 Enterprise 通道。后续将持续关注,第一时间更新基准测试与 API 定价信息。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享