Nemotron 开源技术能够帮助开发者与企业构建强大的通用和专用智能系统。
开放技术可供开发者与企业自由使用、修改和创新,贯穿了从互联网诞生到云计算早期的每次重大技术变革。AI 也不该例外。
因此,NVIDIA Nemotron多模态 AI 模型、数据集和技术已向公众全面开放。Nemotron 可用于本地个人电脑到企业级系统上的研究与商业用途,提供了一个开放的 AI 应用构建基础平台。开发者可通过 GitHub、Hugging Face 和 OpenRouter 使用。
通过 Nemotron,开发者、初创公司及各种规模的企业都能使用基于透明开源训练数据训练而成的模型。此外,Nemotron 还提供加速工具,覆盖从定制到部署的全开发流程。
由于该技术的公开透明性,使用者能够理解模型的运作机制并信任其输出结果。
凭借其在通用智能与代理式 AI 推理方面的能力,以及对特定 AI 用例的适应性,Nemotron 如今已被制造、医疗、教育及零售等行业的 AI 创新者与领导者广泛使用。
什么是 NVIDIA Nemotron?
NVIDIA Nemotron 是一套专为提高 AI 开发全流程效率而打造的开源 AI 技术集合,包含:
多模态模型:以开放检查点形式交付的先进 AI 模型,在研究生级别科学推理、高等数学、编码、指令执行、工具调用、视觉推理方面表现出色。
预训练、后训练及多模态数据集:精心筛选的文本、图像和视频数据集合,可用于训练 AI 模型掌握语言、数学和问题解决等技能。
数值精度算法和方案:先进的精度技术,能在保障答案准确性的同时,大幅提升 AI 运行速度并降低成本。
用于高效扩展 GPU 集群上训练规模的系统软件:这是一系列经过优化的软件与框架,可在 NVIDIA GPU 上实现大规模训练与推理加速,适配超大模型的需求。
后训练方法与软件:提高 AI 智能水平、安全性和特定任务处理能力的微调步骤。
NVIDIA 致力于为开发者、行业领导者和公共及私营领域的 AI 基础设施构建者提供开放、透明且自适应的 AI 平台,而 Nemotron 正是该战略的重要组成部分。
通用智能与专用智能有何区别?
NVIDIA 开发 Nemotron 是为了提升通用智能的能力(包括 AI 推理能力),同时加速专业化进程,进而帮助全球企业使用 AI 解决行业难题。
通用智能是指基于海量公开数据集训练而成、可执行广泛任务的模型,是解决各类问题和执行各类推理任务必不可少的引擎。专用智能学习某一行业或组织机构特有的语言、流程及优先事项,使 AI 模型能够适应特定的现实应用。
要实现 AI 在各行业的规模化应用,两者缺一不可。
因此,Nemotron 提供了针对多种计算平台优化的预训练基础模型,以及NVIDIA NeMo和NVIDIA Dynamo等工具,以将通用 AI 模型转化为定制化的专用智能模型。
开发者与企业如何使用 Nemotron?
NVIDIA 开发 Nemotron 的目标是加快全球开发者的工作进程,并且为未来 AI 系统设计指明方向。
无论是研究机构还是初创公司和跨国企业,开发者都需要灵活、可信的 AI。Nemotron 提供了构建、定制和集成 AI 的工具,适用于几乎所有领域。
CrowdStrike正将面向安全团队的 Charlotte AI AgentWorks 无代码平台与 Nemotron 集成,帮助推动代理式生态系统的发展并保护其安全。此次合作重新定义了安全运营模式,使分析师能够大规模开发部署专用 AI 智能体,依托 Nemotron 模型打造可信赖的企业级安全防护体系。
DataRobot将 Nemotron 作为在其与 NVIDIA 合作开发的 Agent Workforce Platform 上大规模训练、定制和管理 AI 智能体的开放基础平台。该解决方案可在本地、混合及多云环境中建立、运营和管理一支功能齐全的 AI 智能体团队。
ServiceNow今年早些时候与 NVIDIA 合作推出了 Apriel Nemotron 15B 模型。该模型使用两家公司的数据进行后训练,专门用于执行实时工作流,并且能以更小规模提供先进的推理,使其更快、更高效并且兼具经济效益。
伦敦大学学院主导的主权 AI 项目UK-LLM使用 Nemotron 开源技术和数据集开发了英语与威尔士语 AI 推理模型。
NVIDIA 还将从开发 Nemotron 获得的洞察,应用于下一代系统设计,例如 Grace Blackwell、Vera Rubin 和 Feynman 等。AI 模型领域的最新创新成果例如精度缩减、稀疏运算、新型注意力机制、优化算法等正在重塑 GPU 架构。
例如,使用 Nemotron 开发的新数据格式 NVFP4 在大语言模型 (LLM) 训练中每个参数仅用 4 位存储。这项突破性进展大大降低了能耗,正在影响着未来 NVIDIA 系统架构的设计方向。
NVIDIA 还借助整个 AI 社区开发的开放技术优化 Nemotron。
阿里巴巴Qwen 开源模型提供的数据增强方案优化了 Nemotron 的预训练与后训练数据集。其最新 Qwen3-Next 架构突破了长上下文 AI 的技术边界。该模型融合了 NVIDIA 研究中心与麻省理工学院共同开发的门控增量网络 (Gated Delta Networks)。
作为 AI 推理领域的先驱,DeepSeek R1推动了 Nemotron 数学、代码与推理开源数据集的开发,这些数据集可用于训练模型掌握思考能力。
OpenAI的 gpt-oss 开源权重模型具有出色的推理、数学和工具调用能力,凭借其可调节的推理设置,可用于强化 Nemotron 后训练数据集。
Llama-Nemotron 开放模型系列以Meta的 Llama 开放模型集合为基础,并借助 Nemotron 数据集和方法获得了先进的推理能力。
您可在 Hugging Face 上使用 NVIDIA Nemotron 模型与数据,来训练和定制您自己的 AI 模型与智能体,或在 OpenRouter 上免费试用模型。使用 NVIDIA RTX PC 的开发者可通过 llama.cpp 框架获取 Nemotron。
-
NVIDIA
+关注
关注
14文章
5496浏览量
109076 -
AI
+关注
关注
89文章
38090浏览量
296510 -
模型
+关注
关注
1文章
3648浏览量
51710
原文标题:公开的秘密:NVIDIA Nemotron 模型、数据集和技术如何推动 AI 发展
文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025构建高性能AI应用
利用NVIDIA Cosmos开放世界基础模型加速物理AI开发
欧洲借助NVIDIA Nemotron优化主权大语言模型
NVIDIA携手微软加速代理式AI发展
ServiceNow携手NVIDIA构建150亿参数超级助手
企业使用NVIDIA NeMo微服务构建AI智能体平台
Cadence 利用 NVIDIA Grace Blackwell 加速AI驱动的工程设计和科学应用
NVIDIA 推出开放推理 AI 模型系列,助力开发者和企业构建代理式 AI 平台

NVIDIA Nemotron模型如何推动AI发展
评论