0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Nemotron模型如何推动AI发展

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-10-13 11:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Nemotron 开源技术能够帮助开发者与企业构建强大的通用和专用智能系统。

开放技术可供开发者与企业自由使用、修改和创新,贯穿了从互联网诞生到云计算早期的每次重大技术变革。AI 也不该例外。

因此,NVIDIA Nemotron多模态 AI 模型、数据集和技术已向公众全面开放。Nemotron 可用于本地个人电脑到企业级系统上的研究与商业用途,提供了一个开放的 AI 应用构建基础平台。开发者可通过 GitHub、Hugging Face 和 OpenRouter 使用。

通过 Nemotron,开发者、初创公司及各种规模的企业都能使用基于透明开源训练数据训练而成的模型。此外,Nemotron 还提供加速工具,覆盖从定制到部署的全开发流程。

由于该技术的公开透明性,使用者能够理解模型的运作机制并信任其输出结果。

凭借其在通用智能与代理式 AI 推理方面的能力,以及对特定 AI 用例的适应性,Nemotron 如今已被制造、医疗、教育及零售等行业的 AI 创新者与领导者广泛使用。

什么是 NVIDIA Nemotron?

NVIDIA Nemotron 是一套专为提高 AI 开发全流程效率而打造的开源 AI 技术集合,包含:

多模态模型:以开放检查点形式交付的先进 AI 模型,在研究生级别科学推理、高等数学、编码、指令执行、工具调用、视觉推理方面表现出色。

预训练、后训练及多模态数据集:精心筛选的文本、图像和视频数据集合,可用于训练 AI 模型掌握语言、数学和问题解决等技能。

数值精度算法和方案:先进的精度技术,能在保障答案准确性的同时,大幅提升 AI 运行速度并降低成本。

用于高效扩展 GPU 集群上训练规模的系统软件:这是一系列经过优化的软件与框架,可在 NVIDIA GPU 上实现大规模训练与推理加速,适配超大模型的需求。

后训练方法与软件:提高 AI 智能水平、安全性和特定任务处理能力的微调步骤。

NVIDIA 致力于为开发者、行业领导者和公共及私营领域的 AI 基础设施构建者提供开放、透明且自适应的 AI 平台,而 Nemotron 正是该战略的重要组成部分。

通用智能与专用智能有何区别?

NVIDIA 开发 Nemotron 是为了提升通用智能的能力(包括 AI 推理能力),同时加速专业化进程,进而帮助全球企业使用 AI 解决行业难题。

通用智能是指基于海量公开数据集训练而成、可执行广泛任务的模型,是解决各类问题和执行各类推理任务必不可少的引擎。专用智能学习某一行业或组织机构特有的语言、流程及优先事项,使 AI 模型能够适应特定的现实应用。

要实现 AI 在各行业的规模化应用,两者缺一不可。

因此,Nemotron 提供了针对多种计算平台优化的预训练基础模型,以及NVIDIA NeMo和NVIDIA Dynamo等工具,以将通用 AI 模型转化为定制化的专用智能模型。

开发者与企业如何使用 Nemotron?

NVIDIA 开发 Nemotron 的目标是加快全球开发者的工作进程,并且为未来 AI 系统设计指明方向。

无论是研究机构还是初创公司和跨国企业,开发者都需要灵活、可信的 AI。Nemotron 提供了构建、定制和集成 AI 的工具,适用于几乎所有领域。

CrowdStrike正将面向安全团队的 Charlotte AI AgentWorks 无代码平台与 Nemotron 集成,帮助推动代理式生态系统的发展并保护其安全。此次合作重新定义了安全运营模式,使分析师能够大规模开发部署专用 AI 智能体,依托 Nemotron 模型打造可信赖的企业级安全防护体系。

DataRobot将 Nemotron 作为在其与 NVIDIA 合作开发的 Agent Workforce Platform 上大规模训练、定制和管理 AI 智能体的开放基础平台。该解决方案可在本地、混合及多云环境中建立、运营和管理一支功能齐全的 AI 智能体团队。

ServiceNow今年早些时候与 NVIDIA 合作推出了 Apriel Nemotron 15B 模型。该模型使用两家公司的数据进行后训练,专门用于执行实时工作流,并且能以更小规模提供先进的推理,使其更快、更高效并且兼具经济效益。

伦敦大学学院主导的主权 AI 项目UK-LLM使用 Nemotron 开源技术和数据集开发了英语与威尔士语 AI 推理模型。

NVIDIA 还将从开发 Nemotron 获得的洞察,应用于下一代系统设计,例如 Grace Blackwell、Vera Rubin 和 Feynman 等。AI 模型领域的最新创新成果例如精度缩减、稀疏运算、新型注意力机制、优化算法等正在重塑 GPU 架构。

例如,使用 Nemotron 开发的新数据格式 NVFP4 在大语言模型 (LLM) 训练中每个参数仅用 4 位存储。这项突破性进展大大降低了能耗,正在影响着未来 NVIDIA 系统架构的设计方向。

NVIDIA 还借助整个 AI 社区开发的开放技术优化 Nemotron。

阿里巴巴Qwen 开源模型提供的数据增强方案优化了 Nemotron 的预训练与后训练数据集。其最新 Qwen3-Next 架构突破了长上下文 AI 的技术边界。该模型融合了 NVIDIA 研究中心与麻省理工学院共同开发的门控增量网络 (Gated Delta Networks)。

作为 AI 推理领域的先驱,DeepSeek R1推动了 Nemotron 数学、代码与推理开源数据集的开发,这些数据集可用于训练模型掌握思考能力。

OpenAI的 gpt-oss 开源权重模型具有出色的推理、数学和工具调用能力,凭借其可调节的推理设置,可用于强化 Nemotron 后训练数据集。

Llama-Nemotron 开放模型系列以Meta的 Llama 开放模型集合为基础,并借助 Nemotron 数据集和方法获得了先进的推理能力。

您可在 Hugging Face 上使用 NVIDIA Nemotron 模型与数据,来训练和定制您自己的 AI 模型与智能体,或在 OpenRouter 上免费试用模型。使用 NVIDIA RTX PC 的开发者可通过 llama.cpp 框架获取 Nemotron。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109076
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296510
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51710

原文标题:公开的秘密:NVIDIA Nemotron 模型、数据集和技术如何推动 AI 发展

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025构建高性能AI应用

    搜索和调用外部 AI 模型的 SQL 原生 API。NVIDIA 与微软共同将 SQL Server 2025 与 NVIDIA Nemotron
    的头像 发表于 12-01 09:31 341次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> RAG和Microsoft SQL Server 2025构建高性能<b class='flag-5'>AI</b>应用

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助
    的头像 发表于 12-01 09:25 486次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的头像 发表于 08-27 12:45 1391次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> Nano 2推理<b class='flag-5'>模型</b>发布

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI
    的头像 发表于 06-12 15:42 924次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 A
    的头像 发表于 05-27 14:03 754次阅读

    ServiceNow携手NVIDIA构建150亿参数超级助手

    Apriel Nemotron 15B 开源大语言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama Nemotron
    的头像 发表于 05-12 15:37 714次阅读

    企业使用NVIDIA NeMo微服务构建AI智能体平台

    已发布的 NeMo 微服务可与合作伙伴平台集成,作为创建 AI 智能体的构建模块,使用商业智能与强大的逻辑推理模型 (包括 NVIDIA Llama Nemotron) 处理更多任务。
    的头像 发表于 04-27 15:05 995次阅读

    Cadence 利用 NVIDIA Grace Blackwell 加速AI驱动的工程设计和科学应用

    提升高达 80 倍 ● 基于全新 NVIDIA Llama Nemotron 推理模型,携手开发面向工程设计和科学应用的全栈代理式 AI 解决方案 ● 率先采用面向
    的头像 发表于 03-24 10:14 1217次阅读

    NVIDIA 推出开放推理 AI 模型系列,助力开发者和企业构建代理式 AI 平台

    NVIDIA 后训练的全新 Llama Nemotron 推理模型,为代理式 AI 提供业务就绪型基础 埃森哲、Amdocs、Atlassian、Box、Cadence、Crowd
    发表于 03-19 09:31 335次阅读
    <b class='flag-5'>NVIDIA</b> 推出开放推理 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力开发者和企业构建代理式 <b class='flag-5'>AI</b> 平台

    NVIDIA使用加速计算与AI推动精准医学发展

    在加利福尼亚州圣克拉拉举行的精准医学世界大会上,NVIDIA推动了医学成像、基因组学、计算化学和 AI 驱动机器人技术的发展而受到表彰。NVID
    的头像 发表于 02-17 17:14 776次阅读

    英伟达发布Nemotron-CC大型AI训练数据库

    近日,英伟达在其官方博客上宣布了一项重大进展,推出了一款名为Nemotron-CC的大型英文AI训练数据库。这一数据库的发布,标志着英伟达在推动大语言模型训练技术方面迈出了重要一步。
    的头像 发表于 01-14 14:14 791次阅读

    NVIDIA推出开放式Llama Nemotron系列模型

    作为 NVIDIA NIM 微服务,开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何
    的头像 发表于 01-09 11:11 1187次阅读

    NVIDIA发布Cosmos™平台,助力物理AI系统发展

    NVIDIA近日宣布推出全新的NVIDIA Cosmos™平台,该平台专为自动驾驶汽车(AV)和机器人等物理AI系统而设计,旨在推动这些领域的快速
    的头像 发表于 01-08 15:36 895次阅读

    NVIDIA推出面向RTX AI PC的AI基础模型

    NVIDIA 今日发布能在 NVIDIA RTX AI PC 本地运行的基础模型,为数字人、内容创作、生产力和开发提供强大助力。
    的头像 发表于 01-08 11:01 870次阅读

    NVIDIA Cosmos世界基础模型平台发布

    NVIDIA 宣布推出NVIDIA Cosmos,该平台由先进的生成式世界基础模型、高级 tokenizer、护栏和加速视频处理管线组成,将推动自动驾驶汽车(AV)和机器人等物理
    的头像 发表于 01-08 10:39 1028次阅读