0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA 推出 Nemotron 3 系列开放模型

海阔天空的专栏 来源:厂商供稿 作者:厂商供稿 2025-12-16 09:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

40a9ce258575e8cbd9c6649bb4166a4c.png

新闻摘要:

● Nemotron 3 系列开放模型包含 Nano、Super 和 Ultra 三种规模,具有极高的效率和领先的精度,适用于代理式 AI 应用开发。

● Nemotron 3 Nano 的吞吐量比 Nemotron 2 Nano 高 4 倍,并通过突破性的异构混合专家 (Hybrid Mixture-of-Experts) 架构,在大规模多智能体系统中实现了领先的每秒生成 token 数。

● Nemotron 通过先进的强化学习技术以及大规模并行多环境后训练,实现了卓越的准确率。

● NVIDIA 率先推出整套前沿的开放模型、训练数据集及强化学习环境与库,助力构建高精度、高效的专业 AI 智能体。

NVIDIA 于 12 月 15 日宣布推出 NVIDIA Nemotron™ 3 系列开放模型、数据和库,为各个行业透明、高效的专业代理式 AI 开发提供助力。

Nemotron 3 模型提供 Nano、Super 和 Ultra 三种规模,采用突破性的异构潜在混合专家 (MoE) 架构,帮助开发者大规模开发并部署可靠的多智能体系统。

随着企业从单模型对话机器人转向协作式多智能体 AI 系统,开发者面临着日益严峻的挑战,包括通信开销、上下文漂移和高推理成本等。此外,开发者需要模型具备透明度,才能信任其用于自动化复杂工作流。Nemotron 3 直面这些挑战,为用户提供开发专业化代理式 AI 所需的性能与开放性。

NVIDIA 创始人兼首席执行官黄仁勋表示:“开放创新是 AI 进步的基础。通过 Nemotron,我们将先进 AI 转化成开放平台,为开发者提供构建大规模代理式系统所需的透明度与效率。”

NVIDIA Nemotron 为 NVIDIA 更广泛的主权 AI 工作提供支持。从欧洲到韩国,企业组织纷纷采用开放、透明、高效的模型开发符合自身数据、法规与价值观的 AI 系统。

Nemotron 系列模型的早期用户包括埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle Cloud Infrastructure、Perplexity、ServiceNow、西门子、新思科技和 Zoom。他们正将 Nemotron 系列模型集成到制造、网络安全、软件开发、媒体、通信等行业的 AI 工作流中。

ServiceNow 董事长兼首席执行官 Bill McDermott 表示:“NVIDIA 与 ServiceNow 多年来一直致力于塑造 AI 的未来,而最好的部分尚未到来。今天,我们在帮助各行业领导者加速推进代理式 AI 战略方面迈出了重要的一步。通过结合 ServiceNow 的智能工作流自动化与 NVIDIA Nemotron 3,我们将以出色的效率、速度与精度继续定义行业标准。”

随着多智能体 AI 系统的扩展,开发者越来越依赖专有模型来实现前沿推理,同时使用更加高效、可定制的开放模型降低成本。在单一工作流中于前沿级模型与 Nemotron 之间进行任务路由,既能赋予智能体强大的智能,同时还可以优化 token 经济效益。

Perplexity 首席执行官 Aravind Srinivas 表示:“Perplexity 的构建理念是当精准 AI 融入先进工具时(例如 AI 助手),人类的好奇心将被放大。通过我们的智能体路由器,可以将工作负载定向到领先的精细调优开放模型,如 Nemotron 3 Ultra,或在任务能够从其独特能力中受益时,利用领先的专有模型,以此确保我们的 AI 助手能够以卓越的速度、效率和规模运行。”

Nemotron 3 开放模型使初创公司能够更快开发和迭代 AI 智能体,并加快从原型到企业级部署的创新进程。General Catalyst 和 Mayfield 旗下的投资组合公司正在探索如何使用 Nemotron 3 开发支持人机协作的 AI 队友。

Mayfield 管理合伙人 Navin Chaddha 表示:“NVIDIA 的开放模型堆栈与 NVIDIA 初创加速计划为初创公司提供了各类模型、工具及经济高效的基础设施,助力其开展试验、实现差异化发展并快速扩展规模。Nemotron 3 可以让创始人在构建代理式 AI 应用和 AI 队友方面取得先机,并帮助他们利用 NVIDIA 庞大的用户基础。”

Nemotron 3 以高效和精准重塑多智能体 AI

Nemotron 3 系列 MoE 模型包含三种规模:

● Nemotron 3 Nano:是一款具备300 亿参数的小型模型,每次运行最多激活 30 亿参数,适用于针对性、高效的任务。

● Nemotron 3 Super:是一款具备约 1,000 亿参数的高精度推理模型,每个 token最多激活 100 亿参数,适用于多智能体应用。

● Nemotron 3 Ultra:是一款具备约 5,000 亿参数的大型推理引擎,每个 token 最多激活 500 亿参数,适用于复杂的 AI 应用。

Nemotron 3 Nano 已正式上线,是计算成本效益极高的模型,其针对软件调试、内容摘要、AI 助手工作流及信息检索等任务进行了优化,同时保持了较低的推理成本。该模型采用独特的异构 MoE 架构,以实现效率与可扩展性的提升。

这一设计使其 token 吞吐量较 Nemotron 2 Nano 至高提升 4 倍,并减少了多达 60% 的推理 token 生成量,大大降低了推理成本。具备 100 万 token 的上下文处理能力,Nemotron 3 Nano 具有更强的记忆能力,在处理长时间多步骤任务时能更精准地关联信息。

独立 AI 基准测试机构 Artificial Analysis 评定该模型为同等规模模型中兼具极高开放性和效率及卓越精度的模型。

在需要多智能体协作完成低延迟复杂任务的应用中,Nemotron 3 Super 表现出色。Nemotron 3 Ultra 则作为高级推理引擎,服务于需要深度研究和策略规划的 AI 工作流。

Nemotron 3 Super 与 Ultra 采用基于 NVIDIA Blackwell 架构的超高效 4 位 NVFP4 训练格式,可显著降低显存需求并加速训练进程。这种效率使更大规模模型能在现有基础设施上进行训练,不会因更高精度格式而牺牲准确性。

借助 Nemotron 3 系列模型,开发者可根据特定工作负载选择适配的开放模型,在数十至数百个智能体间灵活扩展,同时在复杂工作流中获得更快速、精准的长时推理能力。

用于 AI 智能体定制的全新开放工具与数据

NVIDIA 还发布了面向专业 AI 智能体开发者的训练数据集与前沿强化学习库集合。

3 万亿 token 规模的全新 Nemotron 预训练、后训练及强化学习数据集,为开发高性能特定领域智能体提供了丰富的推理、编码及多步骤工作流范例。Nemotron Agentic Safety Dataset 则提供真实场景的遥测数据,帮助团队评估并提升复杂智能体系统的安全性。

为加速开发进程,NVIDIA 发布了 NeMo Gym 与NeMo RL 开源库,为 Nemotron 模型提供训练环境及后训练基础,同时还推出用于验证模型安全性和性能的 NeMo Evaluator。所有工具及数据集现已上线 GitHub 和 Hugging Face 平台。

Nemotron 3 已获得 LM Studio 、llama.cpp、SGLang 和vLLM 支持。此外,Prime Intellect 与 Unsloth 正将 NeMo Gym 的即用型训练环境直接集成至其工作流,使团队能够更加快速、便捷地获得强大的强化学习训练能力。

开始使用 NVIDIA 开放模型

Nemotron 3 Nano 现已上线 Hugging Face 平台,并通过Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI 等推理服务商提供。

Nemotron 还上线了多个企业级 AI 与数据基础设施平台,包括 Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。此外,Nemotron 3 Nano 将通过 Amazon Bedrock(无服务器模式)在亚马逊云科技 (AWS) 平台上提供给使用公有云的客户,并且也即将支持 Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale 及 Yotta。

Nemotron 3 Nano 同时以 NVIDIA NIM 形式提供,可在 NVIDIA 加速基础设施上进行安全、可扩展的部署,具有极高的隐私性与可控性。

Nemotron 3 Super 和 Ultra 预计将于 2026 年上半年推出。

关于 NVIDIA

NVIDIA (NASDAQ: NVDA) 是 AI 和加速计算领域的全球领导者。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5511

    浏览量

    109159
  • AI
    AI
    +关注

    关注

    90

    文章

    38303

    浏览量

    297387
  • 模型
    +关注

    关注

    1

    文章

    3656

    浏览量

    51757
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA推动面向数字与物理AI的开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA) NVIDIA DRI
    的头像 发表于 12-13 09:50 824次阅读

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025构建高性能AI应用

    搜索和调用外部 AI 模型的 SQL 原生 API。NVIDIA 与微软共同将 SQL Server 2025 与 NVIDIA Nemotron RAG
    的头像 发表于 12-01 09:31 438次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> RAG和Microsoft SQL Server 2025构建高性能AI应用

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助
    的头像 发表于 12-01 09:25 599次阅读

    面向科学仿真的开放模型系列NVIDIA Apollo正式发布

    用于加速工业和计算工程的开放模型系列 NVIDIA Apollo 于近日举行的 SC25 大会上正式发布。
    的头像 发表于 11-25 11:15 3.9w次阅读

    NVIDIA Nemotron模型如何推动AI发展

    Nemotron 开源技术能够帮助开发者与企业构建强大的通用和专用智能系统。
    的头像 发表于 10-13 11:12 755次阅读

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3 和 Gemma 3
    的头像 发表于 09-11 15:09 920次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA
    的头像 发表于 08-27 12:45 1438次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> Nano 2推理<b class='flag-5'>模型</b>发布

    英伟达打响“小模型”第一枪

    电子发烧友网综合报道 , 近日,Nvidia 推出了一款新的小型语言模型 Nemotron-Nano-9B-v2,该模型在多项基准测试中表现
    发表于 08-24 01:18 1317次阅读

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI。
    的头像 发表于 06-12 15:42 951次阅读

    ServiceNow携手NVIDIA构建150亿参数超级助手

    Apriel Nemotron 15B 开源大语言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama Nemotron
    的头像 发表于 05-12 15:37 736次阅读

    NVIDIA RTX 5880 Ada与Qwen3系列模型实测报告

    近日,阿里巴巴通义千问团队正式推出新一代开源大语言模型——Qwen3 系列,该系列包含 6 款 Dense 稠密
    的头像 发表于 05-09 15:05 3909次阅读
    <b class='flag-5'>NVIDIA</b> RTX 5880 Ada与Qwen<b class='flag-5'>3</b><b class='flag-5'>系列</b><b class='flag-5'>模型</b>实测报告

    NVIDIA使用Qwen3系列模型的最佳实践

    阿里巴巴近期发布了其开源的混合推理大语言模型 (LLM) 通义千问 Qwen3,此次 Qwen3 开源模型系列包含两款混合专家
    的头像 发表于 05-08 11:45 2647次阅读
    <b class='flag-5'>NVIDIA</b>使用Qwen<b class='flag-5'>3</b><b class='flag-5'>系列</b><b class='flag-5'>模型</b>的最佳实践

    英伟达GTC2025亮点 NVIDIA推出Cosmos世界基础模型和物理AI数据工具的重大更新

    、Figure AI、Skild AI 是最早采用该技术的公司。 NVIDIA 宣布推出全新 NVIDIA Cosmos 世界基础模型 (WFM) 的重大更新,该
    的头像 发表于 03-20 19:01 1194次阅读

    NVIDIA 推出开放推理 AI 模型系列,助力开发者和企业构建代理式 AI 平台

    月 18 日 ——  NVIDIA 今日发布具有推理功能的开源 Llama Nemotron 模型系列,旨在为开发者和企业提供业务就绪型基础,助力构建能够独立工作或以团队形式完成复杂
    发表于 03-19 09:31 339次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>推出</b><b class='flag-5'>开放</b>推理 AI <b class='flag-5'>模型</b><b class='flag-5'>系列</b>,助力开发者和企业构建代理式 AI 平台

    NVIDIA推出开放式Llama Nemotron系列模型

    作为 NVIDIA NIM 微服务,开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言
    的头像 发表于 01-09 11:11 1214次阅读