NVIDIA 发布开源大模型 Nemotron 3 Super:性能直逼 GPT-5.4

2026 年 3 月 12 日,英伟达正式发布了专为 AI 智能体设计的新一代开源大模型Nemotron 3 Super,这款采用Mamba-MoE 混合架构的模型凭借卓越的推理效率,在多项测评中表现逼近 GPT-5.4 等闭源顶级模型,成为开源社区的新焦点。该模型参数总量1200 亿,激活参数仅120 亿,推理速度提升3 倍,吞吐量暴涨5 倍,支持高达1M 的超长上下文

一、架构革新:Mamba-MoE 混合设计,推理速度暴增 300%

Nemotron 3 Super 采用创新的Mamba-MoE 混合架构,总参数量 1200 亿,激活参数仅 120 亿。这种稀疏激活设计让模型在保持强大性能的同时,推理速度提升 3 倍,吞吐量暴涨 5 倍。支持高达 1M 的超长上下文,有效解决多智能体协同中的"目标跑偏"和"上下文爆炸"问题。为了充分发挥自研硬件优势,Nemotron 3 Super 除支持 BF16 和 FP8 格式外,还专门针对英伟达最新的Blackwell 平台支持 NVFP4 训练,大幅降低大模型训练成本,提升算力利用率。

GPU 芯片技术

二、性能表现:开源界性能天花板,多项测评登顶第一

在权威测评中,Nemotron 3 Super 登顶 Artificial Analysis 效率与开放性榜单,驱动英伟达 AI-Q 智能体在DeepResearch Bench 双榜位列第一。在OpenClaw 智能体任务中成功率高达 85.6%,表现已逼近 Claude Opus 4.6 和 GPT-5.4 等闭源模型。这一成绩标志着开源大模型在性能上已逼近闭源模型的第一梯队,为开发者提供了一个低成本、高性能的替代方案,正在改变闭源大模型的市场格局。

神经网络 AI

三、生态整合:大厂集体集成,上线主流云平台

目前,Nemotron 3 Super 已被Perplexity、Palantir、西门子、戴尔等多家科技巨头集成,并同步上线 AWS、Azure 和 Google Cloud 等主流云平台。开发者可通过 Hugging Face、GitHub 等渠道免费获取该模型。作为一款开源免费模型,Nemotron 3 Super 为开发者提供了低成本、高性能的替代方案,极大地冲击了当前闭源大模型的市场格局,让更多企业和个人能够负担得起大模型的应用和开发。

数据中心服务器

AD:精心整理了2000+好用的AI工具!点此获取

相关推荐

1 1

免费AI工具合集,点击进入

AI对话

玉米AI助手