英伟达 GB200 NVL72 表现震撼，较 AMD MI355X 高出 28 倍-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

在最新公布的 SemiAnalysis InferenceMAX 基准测试中，Signal65 对 Deepseek-R1 0528 混合专家（MoE）模型的推理表现进行了评估。结果显示，英伟达（NVIDIA）GB200 NVL72 机架系统在同等规模下的性能明显领先 AMD Instinct MI355X 集群。混合专家模型会根据任务类型激活最合适的“专家”，效率更高，但在大规模扩展时，节点之间的通信延迟与带宽压力会增大，容易成为计算瓶颈。

英伟达通过 “极致协同设计” 思路优化了 GB200 NVL72 的架构。该系统将 72 颗芯片紧密互联，并提供最高 30TB 的共享内存，大幅提升数据传输效率，缓解延迟问题。依据测试数据，在相似配置下，GB200 NVL72 每块 GPU 的吞吐量可达 75 tokens / 秒，性能是 AMD MI355X 的 28 倍。

对超大规模云服务商来说，整体拥有成本（TCO）是关键指标。Signal65 结合 Oracle 云定价显示，GB200 NVL72 不仅跑得快，成本表现也很亮眼。其每个 token 的相对成本仅为 AMD 方案的十五分之一，同时带来更快的交互速度。

虽然英伟达在混合专家模型赛道占据优势，AMD 仍有自己的强项。报告提到，AMD MI355X 依靠大容量 HBM3e 内存，在稠密模型场景中依旧具备竞争力。目前，AMD 尚未发布能直接对标 GB200 NVL72 的机架级新方案。不过，随着 AMD Helios 与英伟达 Vera Rubin 平台的对决升温，未来在机架级扩展上的竞争只会更激烈。