NVIDIA推出开源大模型Nemotron 3 Super:表现接近GPT-5.4

英伟达(NVIDIA)在AI大模型领域又放出重磅消息。3月12日,英伟达面向AI智能体(Agent)正式发布新一代开源模型——Nemotron3Super。该模型凭借极高的推理效率和优秀的任务成功率,迅速成为开源社区关注的焦点。

架构升级:推理速度提升300%

Nemotron3Super采用了全新的 Mamba-MoE 混合架构,参数总量为1200亿,激活参数仅120亿。这样的设计在保证强劲性能的同时,让推理提速3倍,吞吐量也提升5倍。此外,模型支持最长 1M 上下文,有效缓解多智能体协同中常见的“目标跑偏”“上下文爆炸”问题。

image.png

实力刷榜:开源界的“性能天花板

在多项权威评测中,Nemotron3Super表现亮眼。它不仅拿下了 Artificial Analysis 的效率与开放性榜单榜首,还推动英伟达自研的 AI-Q 智能体在 DeepResearch Bench 双榜位列第一。值得一提的是,该模型在热门智能体任务 OpenClaw 中的成功率达到85.6%,已逼近闭源大模型 Claude Opus4.6 和 GPT-5.4。

适配“黑格尔”平台:支持NVFP4训练

为更好发挥自研硬件优势,Nemotron3Super除支持 BF16 和 FP8 外,还面向英伟达最新的 Blackwell 平台及后续架构,加入了 NVFP4 训练支持。这将进一步降低大模型训练成本,并提升算力利用率。

生态联动:大厂集体集成

目前,Nemotron3Super已被 Perplexity、Palantir、西门子与戴尔等多家科技公司集成,并同步登陆 AWS、Azure 和 Google Cloud 等主流云平台。作为一款开源免费的模型,它为开发者提供了低成本、高性能的选择,对现有闭源大模型的市场格局带来强烈冲击。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享