值得信赖的区块链资讯!
比推数据  |  比推终端  |  比推英文  |  比推 APP  | 

下载比推 APP

值得信赖的区块链资讯!
iPhone
Android

英伟达正式开源旗舰级 550B 模型 Nemotron 3 Ultra:首创 Mamba-Transformer 混合 MoE 架构,专为长程智能体而生

比推消息,据监测,英伟达于 6 月 4 日正式开源 5500 亿参数、激活 550 亿的旗舰大语言模型 Nemotron 3 Ultra,针对复杂规划、推理和工具调用等长程智能体任务进行了优化。在第三方基准平台 Artificial Analysis 的智能指数中,Nemotron 3 Ultra 得分 48 分,是目前美国本土性能最强的开源权重模型,仅次于月之暗面得分 54 分的 Kimi K2.6。技术架构上,模型采用 Mamba-Transformer 混合专家架构 MoE,通过交替使用 Mamba-2 状态空间模型层与 Transformer 自注意力层,规避了超长上下文下 KV 缓存呈二次方增长的内存瓶颈,在极低内存开销下支持 100 万 token 的上下文窗口。相比同规模 dense 模型,混合架构在智能体任务下提升了 5 倍吞吐量,并降低了 30% 的推理成本。生态配套上,英伟达同步发布了包含 NemoClaw 编排蓝图与 OpenShell 运行时的智能体工具包 Agent Toolkit。开源内容直接包含模型权重、数据集与训练配方。模型已在 Hugging Face、NVIDIA NIM 及 OpenRouter 上线,企业级 AI 搜索服务商 Glean 等已宣布接入,用作商业闭源大模型的替代方案。

说明: 比推所有文章只代表作者观点,不构成投资建议

比推快讯

更多 >>

下载比推 APP

24 小时追踪区块链行业资讯、热点头条、事实报道、深度洞察。

邮件订阅

金融科技决策者们都在看的区块链简报与深度分析,「比推」帮你划重点。