NVIDIA 发布开源大模型 Nemotron 3 Super：性能直逼 GPT-5.4

2026 年 3 月 12 日，英伟达正式发布了专为 AI 智能体设计的新一代开源大模型Nemotron 3 Super，这款采用Mamba-MoE 混合架构的模型凭借卓越的推理效率，在多项测评中表现逼近 GPT-5.4 等闭源顶级模型，成为开源社区的新焦点。该模型参数总量1200 亿，激活参数仅120 亿，推理速度提升3 倍，吞吐量暴涨5 倍，支持高达1M 的超长上下文。

一、架构革新：Mamba-MoE 混合设计，推理速度暴增 300%

Nemotron 3 Super 采用创新的Mamba-MoE 混合架构，总参数量 1200 亿，激活参数仅 120 亿。这种稀疏激活设计让模型在保持强大性能的同时，推理速度提升 3 倍，吞吐量暴涨 5 倍。支持高达 1M 的超长上下文，有效解决多智能体协同中的"目标跑偏"和"上下文爆炸"问题。为了充分发挥自研硬件优势，Nemotron 3 Super 除支持 BF16 和 FP8 格式外，还专门针对英伟达最新的Blackwell 平台支持 NVFP4 训练，大幅降低大模型训练成本，提升算力利用率。

GPU 芯片技术

二、性能表现：开源界性能天花板，多项测评登顶第一

在权威测评中，Nemotron 3 Super 登顶 Artificial Analysis 效率与开放性榜单，驱动英伟达 AI-Q 智能体在DeepResearch Bench 双榜位列第一。在OpenClaw 智能体任务中成功率高达 85.6%，表现已逼近 Claude Opus 4.6 和 GPT-5.4 等闭源模型。这一成绩标志着开源大模型在性能上已逼近闭源模型的第一梯队，为开发者提供了一个低成本、高性能的替代方案，正在改变闭源大模型的市场格局。

神经网络 AI

三、生态整合：大厂集体集成，上线主流云平台

目前，Nemotron 3 Super 已被Perplexity、Palantir、西门子、戴尔等多家科技巨头集成，并同步上线 AWS、Azure 和 Google Cloud 等主流云平台。开发者可通过 Hugging Face、GitHub 等渠道免费获取该模型。作为一款开源免费模型，Nemotron 3 Super 为开发者提供了低成本、高性能的替代方案，极大地冲击了当前闭源大模型的市场格局，让更多企业和个人能够负担得起大模型的应用和开发。

数据中心服务器

AD：精心整理了2000+好用的AI工具！点此获取

NVIDIA 发布开源大模型 Nemotron 3 Super：性能直逼 GPT-5.4

一、架构革新：Mamba-MoE 混合设计，推理速度暴增 300%

二、性能表现：开源界性能天花板，多项测评登顶第一

三、生态整合：大厂集体集成，上线主流云平台

腾讯 WorkBuddy 发布升级：支持微信一键直连与自动化任务执行

读完 500 万篇新闻，谷歌 Gemini 成功预测全球山洪灾害

玉米AI助手

NVIDIA 发布开源大模型 Nemotron 3 Super：性能直逼 GPT-5.4

一、架构革新：Mamba-MoE 混合设计，推理速度暴增 300%

二、性能表现：开源界性能天花板，多项测评登顶第一

三、生态整合：大厂集体集成，上线主流云平台

腾讯 WorkBuddy 发布升级：支持微信一键直连与自动化任务执行

读完 500 万篇新闻，谷歌 Gemini 成功预测全球山洪灾害

相关推荐

玉米AI助手

搜索

NVIDIA 发布开源大模型 Nemotron 3 Super：性能直逼 GPT-5.4

NVIDIA 发布开源大模型 Nemotron 3 Super：性能直逼 GPT-5.4