据多位消息人士称,全球 AI 龙头 OpenAI 近期正有计划地寻找英伟达之外的算力替代方案。原因在于他们对英伟达最新一代 AI 芯片在某些推理环节(尤其是响应速度)的表现不满意。
核心痛点:推理速度制约用户体验
OpenAI发现,在代码生成和复杂软件系统交互的用例中,现有硬件的响应速度已经成为瓶颈:
战略重心变化:OpenAI正把关注点从模型“训练”转向“推理”(也就是向终端用户输出答案的过程)。
延迟与吞吐:推理阶段的性能直接影响用户体验和运营成本。在高带宽、低延迟的任务下,传统 GPU 架构因需要频繁访问外置显存而产生额外延迟,让芯片长时间处于“等数据”状态。
专业用户的高要求:CEO 山姆·奥特曼表示,开发者等专业用户对代码类模型的生成速度非常敏感,而当前硬件架构限制了产品体验。
替代方案:牵手推理加速“新势力”
为缓解硬件瓶颈,OpenAI计划引入新型硬件,来分担未来约10% 的推理算力需求:
引入 Cerebras:OpenAI已与 Cerebras 达成合作。其架构在同一颗芯片中集成了海量静态存储(SRAM),可大幅缩短访问路径,提升响应速度。
洽谈 Groq:公司此前也与 Groq 接触,希望利用其推理加速优势来优化聊天机器人等 AI 系统。
巨头博弈:原本“板上钉钉”的投资生变
技术路线的调整,也让OpenAI与长期核心供应商英伟达的关系更为微妙:
千亿交易搁置:双方原本洽谈一项涉及1000亿美元 的投资与供货协议(英伟达以芯片换股权),但该谈判已拖延数月。
采购更为多元:OpenAI已与 AMD 等其他厂商签署新的 GPU 采购或合作协议,进一步降低对单一供应商的依赖。
竞争压力:相比之下,Anthropic 的 Claude 以及谷歌的 Gemini 更多依赖谷歌自研的 TPU,这类专用芯片在推理任务上的天然优势,给英伟达带来不小压力。
尽管双方在公开场合仍维持积极合作的形象,英伟达CEO 黄仁勋也否认不和传闻,但随着OpenAI开始实际为第三方推理芯片下单,AI 算力市场的“一超多强”格局正面临重塑。


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?