英伟达(NVIDIA)在AI大模型领域又放出重磅消息。3月12日,英伟达面向AI智能体(Agent)正式发布新一代开源模型——Nemotron3Super。该模型凭借极高的推理效率和优秀的任务成功率,迅速成为开源社区关注的焦点。
架构升级:推理速度提升300%
Nemotron3Super采用了全新的 Mamba-MoE 混合架构,参数总量为1200亿,激活参数仅120亿。这样的设计在保证强劲性能的同时,让推理提速3倍,吞吐量也提升5倍。此外,模型支持最长 1M 上下文,有效缓解多智能体协同中常见的“目标跑偏”“上下文爆炸”问题。

实力刷榜:开源界的“性能天花板”
在多项权威评测中,Nemotron3Super表现亮眼。它不仅拿下了 Artificial Analysis 的效率与开放性榜单榜首,还推动英伟达自研的 AI-Q 智能体在 DeepResearch Bench 双榜位列第一。值得一提的是,该模型在热门智能体任务 OpenClaw 中的成功率达到85.6%,已逼近闭源大模型 Claude Opus4.6 和 GPT-5.4。
适配“黑格尔”平台:支持NVFP4训练
为更好发挥自研硬件优势,Nemotron3Super除支持 BF16 和 FP8 外,还面向英伟达最新的 Blackwell 平台及后续架构,加入了 NVFP4 训练支持。这将进一步降低大模型训练成本,并提升算力利用率。
生态联动:大厂集体集成
目前,Nemotron3Super已被 Perplexity、Palantir、西门子与戴尔等多家科技公司集成,并同步登陆 AWS、Azure 和 Google Cloud 等主流云平台。作为一款开源免费的模型,它为开发者提供了低成本、高性能的选择,对现有闭源大模型的市场格局带来强烈冲击。
用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?