英伟达 GB200 NVL72 表现震撼,较 AMD MI355X 高出 28 倍

最新公布的 SemiAnalysis InferenceMAX 基准测试中,Signal65 对 Deepseek-R1 0528 混合专家(MoE)模型的推理表现进行了评估。结果显示,英伟达(NVIDIA)GB200 NVL72 机架系统在同等规模下的性能明显领先 AMD Instinct MI355X 集群。混合专家模型会根据任务类型激活最合适的“专家”,效率更高,但在大规模扩展时,节点之间的通信延迟与带宽压力会增大,容易成为计算瓶颈。

英伟达通过 “极致协同设计” 思路优化了 GB200 NVL72 的架构。该系统将 72 颗芯片紧密互联,并提供最高 30TB 的共享内存,大幅提升数据传输效率,缓解延迟问题。依据测试数据,在相似配置下,GB200 NVL72 每块 GPU 的吞吐量可达 75 tokens / 秒,性能是 AMD MI355X 的 28 倍。

对超大规模云服务商来说,整体拥有成本(TCO)是关键指标。Signal65 结合 Oracle 云定价显示,GB200 NVL72 不仅跑得快,成本表现也很亮眼。其每个 token 的相对成本仅为 AMD 方案的十五分之一,同时带来更快的交互速度。

虽然英伟达在混合专家模型赛道占据优势,AMD 仍有自己的强项。报告提到,AMD MI355X 依靠大容量 HBM3e 内存,在稠密模型场景中依旧具备竞争力。目前,AMD 尚未发布能直接对标 GB200 NVL72 的机架级新方案。不过,随着 AMD Helios 与英伟达 Vera Rubin 平台的对决升温,未来在机架级扩展上的竞争只会更激烈。

划重点:  

🟢 英伟达 GB200 NVL72 的性能相较 AMD MI355X 高出 28 倍,优势明显。  

🟢 GB200 NVL72 通过架构优化与高速共享内存,显著降低数据传输延迟。  

🟢 英伟达领先的同时,AMD 在稠密模型领域仍具实力,双方竞争将持续升温。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享