英伟达发布Nemotron 3系列开放模型,引领AI创新浪潮
英伟达发布了全新的开放模型系列,名为Nemotron 3系列,该系列模型具备卓越的性能和灵活性,旨在满足各种应用场景的需求,通过采用先进的深度学习技术,Nemotron 3系列模型能够在图像识别、自然语言处理等领域实现出色的表现,该系列模型的开放性质将促进开发者社区的创新和合作,推动人工智能技术的发展和应用,英伟达表示,Nemotron 3系列模型的发布将为用户带来更高效、智能的体验。
英伟达正式发布 nvidia nemotron™ 3 系列开源模型、训练数据集及配套工具库,旨在为各领域开发者提供透明、高效、可信赖的专业级代理式人工智能开发支持。

Nemotron 3 系列基于创新的异构稀疏混合专家(MoE)架构,推出 Nano、Super 和 Ultra 三大规格模型,全面赋能大规模、高可靠性的多智能体系统研发与落地。
- Nemotron 3 Nano:轻量级模型,参数总量约 300 亿,单次前向推理仅激活最多 30 亿参数,专为低延迟、高效率的垂直任务设计。
- Nemotron 3 Super:高性能推理模型,总参数量约为 1,000 亿,每生成一个 token 最多调用 100 亿参数,适用于需协同决策的多智能体场景。
- Nemotron 3 Ultra:超大规模推理引擎,参数总量达约 5,000 亿,单 token 激活上限为 500 亿参数,面向高度复杂、强推理需求的前沿 AI 应用。

Nemotron 3 Nano 已全面开放使用,凭借卓越的性价比成为资源敏感型场景的理想选择。该模型在软件缺陷诊断、长文本摘要生成、AI 助理交互流程构建以及精准信息检索等任务上完成深度优化,在保障响应质量的同时显著压降推理开销。其核心依托异构 MoE 架构,在计算效率与系统扩展性之间实现更优平衡。

实测数据显示,相较上一代 Nemotron 2 Nano,本模型 token 吞吐能力最高提升达 4 倍,同时 token 生成量减少最高达 60%,进一步压缩部署成本。支持高达 100 万 token 的上下文窗口,赋予模型更强的长期记忆与跨步骤语义关联能力,显著提升多阶段复杂任务的执行准确性。
模型下载地址:https://www.php.cn/link/e019c9de73f6441a1e1d8b26404fdb6f
源代码获取:点击下载
<< 上一篇
网友留言(0 条)