0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Nemotron模型如何推动AI发展

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-10-13 11:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Nemotron 开源技术能够帮助开发者与企业构建强大的通用和专用智能系统。

开放技术可供开发者与企业自由使用、修改和创新,贯穿了从互联网诞生到云计算早期的每次重大技术变革。AI 也不该例外。

因此,NVIDIA Nemotron多模态 AI 模型、数据集和技术已向公众全面开放。Nemotron 可用于本地个人电脑到企业级系统上的研究与商业用途,提供了一个开放的 AI 应用构建基础平台。开发者可通过 GitHub、Hugging Face 和 OpenRouter 使用。

通过 Nemotron,开发者、初创公司及各种规模的企业都能使用基于透明开源训练数据训练而成的模型。此外,Nemotron 还提供加速工具,覆盖从定制到部署的全开发流程。

由于该技术的公开透明性,使用者能够理解模型的运作机制并信任其输出结果。

凭借其在通用智能与代理式 AI 推理方面的能力,以及对特定 AI 用例的适应性,Nemotron 如今已被制造、医疗、教育及零售等行业的 AI 创新者与领导者广泛使用。

什么是 NVIDIA Nemotron?

NVIDIA Nemotron 是一套专为提高 AI 开发全流程效率而打造的开源 AI 技术集合,包含:

多模态模型:以开放检查点形式交付的先进 AI 模型,在研究生级别科学推理、高等数学、编码、指令执行、工具调用、视觉推理方面表现出色。

预训练、后训练及多模态数据集:精心筛选的文本、图像和视频数据集合,可用于训练 AI 模型掌握语言、数学和问题解决等技能。

数值精度算法和方案:先进的精度技术,能在保障答案准确性的同时,大幅提升 AI 运行速度并降低成本。

用于高效扩展 GPU 集群上训练规模的系统软件:这是一系列经过优化的软件与框架,可在 NVIDIA GPU 上实现大规模训练与推理加速,适配超大模型的需求。

后训练方法与软件:提高 AI 智能水平、安全性和特定任务处理能力的微调步骤。

NVIDIA 致力于为开发者、行业领导者和公共及私营领域的 AI 基础设施构建者提供开放、透明且自适应的 AI 平台,而 Nemotron 正是该战略的重要组成部分。

通用智能与专用智能有何区别?

NVIDIA 开发 Nemotron 是为了提升通用智能的能力(包括 AI 推理能力),同时加速专业化进程,进而帮助全球企业使用 AI 解决行业难题。

通用智能是指基于海量公开数据集训练而成、可执行广泛任务的模型,是解决各类问题和执行各类推理任务必不可少的引擎。专用智能学习某一行业或组织机构特有的语言、流程及优先事项,使 AI 模型能够适应特定的现实应用。

要实现 AI 在各行业的规模化应用,两者缺一不可。

因此,Nemotron 提供了针对多种计算平台优化的预训练基础模型,以及NVIDIA NeMo和NVIDIA Dynamo等工具,以将通用 AI 模型转化为定制化的专用智能模型。

开发者与企业如何使用 Nemotron?

NVIDIA 开发 Nemotron 的目标是加快全球开发者的工作进程,并且为未来 AI 系统设计指明方向。

无论是研究机构还是初创公司和跨国企业,开发者都需要灵活、可信的 AI。Nemotron 提供了构建、定制和集成 AI 的工具,适用于几乎所有领域。

CrowdStrike正将面向安全团队的 Charlotte AI AgentWorks 无代码平台与 Nemotron 集成,帮助推动代理式生态系统的发展并保护其安全。此次合作重新定义了安全运营模式,使分析师能够大规模开发部署专用 AI 智能体,依托 Nemotron 模型打造可信赖的企业级安全防护体系。

DataRobot将 Nemotron 作为在其与 NVIDIA 合作开发的 Agent Workforce Platform 上大规模训练、定制和管理 AI 智能体的开放基础平台。该解决方案可在本地、混合及多云环境中建立、运营和管理一支功能齐全的 AI 智能体团队。

ServiceNow今年早些时候与 NVIDIA 合作推出了 Apriel Nemotron 15B 模型。该模型使用两家公司的数据进行后训练,专门用于执行实时工作流,并且能以更小规模提供先进的推理,使其更快、更高效并且兼具经济效益。

伦敦大学学院主导的主权 AI 项目UK-LLM使用 Nemotron 开源技术和数据集开发了英语与威尔士语 AI 推理模型。

NVIDIA 还将从开发 Nemotron 获得的洞察,应用于下一代系统设计,例如 Grace Blackwell、Vera Rubin 和 Feynman 等。AI 模型领域的最新创新成果例如精度缩减、稀疏运算、新型注意力机制、优化算法等正在重塑 GPU 架构。

例如,使用 Nemotron 开发的新数据格式 NVFP4 在大语言模型 (LLM) 训练中每个参数仅用 4 位存储。这项突破性进展大大降低了能耗,正在影响着未来 NVIDIA 系统架构的设计方向。

NVIDIA 还借助整个 AI 社区开发的开放技术优化 Nemotron。

阿里巴巴Qwen 开源模型提供的数据增强方案优化了 Nemotron 的预训练与后训练数据集。其最新 Qwen3-Next 架构突破了长上下文 AI 的技术边界。该模型融合了 NVIDIA 研究中心与麻省理工学院共同开发的门控增量网络 (Gated Delta Networks)。

作为 AI 推理领域的先驱,DeepSeek R1推动了 Nemotron 数学、代码与推理开源数据集的开发,这些数据集可用于训练模型掌握思考能力。

OpenAI的 gpt-oss 开源权重模型具有出色的推理、数学和工具调用能力,凭借其可调节的推理设置,可用于强化 Nemotron 后训练数据集。

Llama-Nemotron 开放模型系列以Meta的 Llama 开放模型集合为基础,并借助 Nemotron 数据集和方法获得了先进的推理能力。

您可在 Hugging Face 上使用 NVIDIA Nemotron 模型与数据,来训练和定制您自己的 AI 模型与智能体,或在 OpenRouter 上免费试用模型。使用 NVIDIA RTX PC 的开发者可通过 llama.cpp 框架获取 Nemotron。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110096
  • AI
    AI
    +关注

    关注

    91

    文章

    40941

    浏览量

    302517
  • 模型
    +关注

    关注

    1

    文章

    3810

    浏览量

    52253

原文标题:公开的秘密:NVIDIA Nemotron 模型、数据集和技术如何推动 AI 发展

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA与亚马逊云科技深化合作伙伴关系

    NVIDIA 和亚马逊云科技 (AWS) 扩展双方合作,增强在 AWS 平台上的由 NVIDIA 驱动的数据处理能力,并增加对 NVIDIA Nemotron 开放
    的头像 发表于 03-23 15:17 422次阅读

    NVIDIA 成立由全球领先 AI 实验室组成的 Nemotron Coalition,推动开放前沿模型发展

    新闻摘要: ● NVIDIA Nemotron Coalition 是模型构建者和 AI 实验室的首个此类全球合作项目,致力于通过共享专业知识、数据和计算来推进开放前沿基础
    的头像 发表于 03-17 11:14 281次阅读
    <b class='flag-5'>NVIDIA</b> 成立由全球领先 <b class='flag-5'>AI</b> 实验室组成的 <b class='flag-5'>Nemotron</b> Coalition,<b class='flag-5'>推动</b>开放前沿<b class='flag-5'>模型</b><b class='flag-5'>发展</b>

    NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展

    新闻摘要: ●NVIDIA Nemotron 3 全模态理解模型 (Omni-understanding Models) 为 AI 智能体提供动力 ,使其能够实现自然对话、复杂推理和高
    的头像 发表于 03-17 09:18 487次阅读
    <b class='flag-5'>NVIDIA</b> 扩展开放<b class='flag-5'>模型</b>系列,<b class='flag-5'>推动</b>代理式、物理和医疗 <b class='flag-5'>AI</b> 下一阶段<b class='flag-5'>发展</b>

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA
    的头像 发表于 03-16 16:27 583次阅读
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>赋能<b class='flag-5'>AI</b>在边缘端落地

    利用NVIDIA Nemotron开放模型构建智能文档处理系统

    基于 NVIDIA Nemotron 开放模型AI 驱动文档智能,增强科学研究、金融和法律等领域工作流。
    的头像 发表于 02-25 11:21 649次阅读

    NVIDIA在CES 2026发布全新开放模型、数据和工具

    为扩展开放模型生态,NVIDIA 发布全新开放模型、数据和工具,推动各行业 AI 技术的发展
    的头像 发表于 01-09 10:42 710次阅读

    NVIDIA 推出 Nemotron 3 系列开放模型

    新闻摘要: ● Nemotron 3 系列开放模型包含 Nano、Super 和 Ultra 三种规模,具有极高的效率和领先的精度,适用于代理式 AI 应用开发。 ● Nemotron
    的头像 发表于 12-16 09:27 800次阅读
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Nemotron</b> 3 系列开放<b class='flag-5'>模型</b>

    NVIDIA推动面向数字与物理AI的开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA) NVIDIA DRI
    的头像 发表于 12-13 09:50 1519次阅读

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025构建高性能AI应用

    搜索和调用外部 AI 模型的 SQL 原生 API。NVIDIA 与微软共同将 SQL Server 2025 与 NVIDIA Nemotron
    的头像 发表于 12-01 09:31 1001次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> RAG和Microsoft SQL Server 2025构建高性能<b class='flag-5'>AI</b>应用

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助
    的头像 发表于 12-01 09:25 1390次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的头像 发表于 08-27 12:45 1991次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> Nano 2推理<b class='flag-5'>模型</b>发布

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI
    的头像 发表于 06-12 15:42 1370次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 A
    的头像 发表于 05-27 14:03 1207次阅读

    ServiceNow携手NVIDIA构建150亿参数超级助手

    Apriel Nemotron 15B 开源大语言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama Nemotron
    的头像 发表于 05-12 15:37 1045次阅读

    企业使用NVIDIA NeMo微服务构建AI智能体平台

    已发布的 NeMo 微服务可与合作伙伴平台集成,作为创建 AI 智能体的构建模块,使用商业智能与强大的逻辑推理模型 (包括 NVIDIA Llama Nemotron) 处理更多任务。
    的头像 发表于 04-27 15:05 1470次阅读