0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用NVIDIA推理模型构建AI智能体

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-08-13 14:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

开放式推理模型能够更快、更广泛地进行思考,为客户服务、网络安全、制造、物流和机器人等领域的 AI 智能体生成更明智的结果。

Capgemini 数据表明,截至 2028 年,AI 智能体将通过推动收入增长与节省成本创造高达 4,500 亿美元的价值。构建这些智能体的开发者正转向更高性能的推理模型,以改进 AI 智能体平台和物理 AI 系统。

NVIDIA 在 SIGGRAPH 大会上宣布扩展两个支持推理功能的系列模型:NVIDIA Nemotron和NVIDIA Cosmos,各行业的领导者都在使用这些模型,通过 AI 智能体和人形机器人编队来提高生产力。

CrowdStrike、Uber、Magna、NetApp 和 Zoom 等一些企业都在使用这些系列模型。

全新 NVIDIA Nemotron Nano 2 和 Llama Nemotron Super 1.5 模型在同等规模模型中的科学推理、数学、编码、工具调用、指令遵循和对话方面展现出优异的精度表现。借助这些新模型,AI 智能体能够提高思考深度和工作效率,从而探索更广泛的选项、加速研究并在设定时限内提供更明智的结果。

模型能被视为 AI 智能体的“大脑”,它提供了核心智能。但要使这类“大脑”在企业中发挥作用,必须将其嵌入到能理解特定工作流以及行业和业务术语,并能够安全运行的智能体中。NVIDIA 可通过领先的库和 AI 蓝图帮助企业大规模部署、定制和管理 AI 智能体,从而弥合这一差距。

Cosmos Reason是用于物理 AI 应用的新型推理视觉语言模型 (VLM),擅长了解现实世界的运作机制,使用结构化推理来理解物理学、客体永久性和时空对齐等概念。

Cosmos Reason 经过量身定制,可作为机器人视觉语言动作 (VLA) 模型的推理主干,或为机器人和智能汽车训练数据评论和注释提供支持,并赋予运行时视觉 AI 智能体在工厂或城市等环境中对时空理解和物理操作的推理能力。

Nemotron:更大限度地提高

代理式企业级 AI 的精度和效率

随着企业开发 AI 智能体来处理复杂的多步骤任务,能够通过高效生成 token 来提供超高推理准确性的模型将可实现大规模智能且自主的决策制定。

NVIDIA Nemotron 包含一系列先进的开放式推理模型,可使用领先的模型、NVIDIA 精选的开放数据集和先进 AI 技术,帮助 AI 智能体提高准确性和效率。

最新 Nemotron 模型在以下三个方面实现了出色的效率:全新混合模型架构、紧凑型量化模型以及可配置的思考预算,可帮助开发者控制 token 生成,从而将推理成本降低 60%。这种组合便于模型更深入地进行推理并更快响应,无需投入更多时间或算力。这意味着能够以更低成本取得更好的结果。

与其他同等规模的领先模型相比,Nemotron Nano 2 将 token 生成提速 6 倍。

Llama Nemotron Super 1.5 在同类产品中实现了领先性能和极高的推理准确性,有助于 AI 智能体更高效地进行推理,做出更明智决策并独立处理复杂任务。它现以 NVFP4(即 4 位浮点)格式提供,与 NVIDIA H100 GPU 相比,在 NVIDIA B200 GPU 上可将吞吐量提高 6 倍。

aaa7a49e-7751-11f0-a18e-92fbcf53809c.png

上图显示,在同一时段内且计算预算相同的情况下,Nemotron 模型的推理实现了极高的准确性,并实现了单位成本下的极佳准确率。

在发布这两个全新 Nemotron 模型的同时,NVIDIA 还宣布推出首个开放 VLM 训练数据集 Llama Nemotron VLM 数据集 v1,该数据集包含 300 万个光学字符识别、视觉 QA 和字幕数据样本,可支持之前发布的 Llama 3.1 Nemotron Nano VL 8B 模型。

除推理模型精度以外,智能体还依赖检索增强生成 (RAG) 技术,跨不同来源从联网数据中获取最新、最相关的信息,以便做出明智决策。最近发布的 Llama 3.2 NeMo Retriever 嵌入模型在三个视觉文档检索排行榜 (ViDoRe V1、ViDoRe V2 和 MTEB VisualDocumentRetrieval) 中均排名前列,可帮助提高智能体系统的准确性。

借助这些推理和信息检索模型,使用AI-Q NVIDIA Blueprint构建的深度研究智能体目前在 DeepResearch Bench 上的开放可移植式智能体排行榜中排名首位。

NVIDIA NeMo和NVIDIA NIM可从开发、部署到智能体系统的监管和优化,支持整个 AI 智能体生命周期。

Cosmos Reason:物理 AI 领域的突破

VLM 标志着计算机视觉和机器人领域的突破,可助力机器识别物体和模式。但是,非推理的 VLM 缺乏理解现实世界并与之交互的能力,意味着它们既无法处理不确定性或新奇的情景,也无法执行复杂的多步骤任务。

NVIDIA Cosmos Reason是一种专为物理 AI 和机器人而打造的全新开放式可定制 70 亿参数推理 VLM。借助 Cosmos Reason,机器人和视觉 AI 智能体能够像人类一样进行推理,利用先验知识、物理理解和常识来了解物理世界并采取行动。

Cosmos Reason 可为机器人和物理 AI 应用提供高级功能,例如训练数据评论和字幕支持、机器人决策制定和视频分析 AI 智能体。

它可以帮助自动处理并标注大型多样化的训练数据集,加速高精度 AI 模型的开发。它也可以充当用于机器人规划的精密推理引擎,从而将复杂指令解析为即使在新环境也可供 VLA 模型执行的步骤。

它还可为NVIDIA Metropolis平台上基于视频搜索和总结 (VSS) NVIDIA Blueprint 构建的视频分析 AI 智能体提供支持,从大量存储或实时的视频数据中获取宝贵见解。这些视觉感知和交互式 AI 智能体可以通过查明异常,来帮助工厂、仓库、零售商店、机场、交叉路口等场所简化操作。

NVIDIA 的机器人研究团队将 Cosmos Reason 用于数据筛选和整理,并将其用作 VLA 模型(例如后续版本的NVIDIA Isaac GR00T NX)背后的 "System 2" 推理 VLM。

现已推出:适用于 AI 智能体和机器人的NVIDIA 推理模型无处不在

多元化企业和咨询行业领导者都在采用 NVIDIA 的最新推理模型。从网络安全到电信,各行业的领导者都开始使用 Nemotron 来构建企业级 AI 智能体。

Zoom计划将 Nemotron 推理模型与 Zoom AI Companion 相结合,帮助做出决策并管理多步骤任务,以便 Zoom Meetings、Zoom Chat 和 Zoom 文档用户执行操作。

CrowdStrike正在测试 Nemotron 模型,以便其 Charlotte AI 智能体在 CrowdStrike Falcon 平台上写入请求。

Amdocs正在其 amAIz 套件中使用 NVIDIA Nemotron 模型,以支持 AI 智能体处理护理、销售、网络和客户支持等领域的复杂、多步骤自动化操作。

鉴于 Nemotron Nano 2 的高吞吐量,安永正采用该模型来支持大型企业组织中的代理式 AI,用于处理税务、风险管理和金融用例。

NetApp正在测试 Nemotron 推理模型,以便 AI 智能体能够搜索和分析业务数据。

DataRobot正在与 Nemotron 模型合作,用于其 Agent Workforce Platform,以实现端到端的智能体生命周期管理。

Tabnine正使用 Nemotron 模型,为开发者提供编码任务建议和实现自动化编码任务。

Automation Anywhere、CrewAI和Dataiku等代理式 AI软件开发商都在其平台中集成了 Nemotron 模型。

交通运输、安全和 AI 智能领域的领先企业正使用 Cosmos Reason 来加强辅助驾驶、视频分析、道路和工作场所的安全。

Uber正在探索如何使用 Cosmos Reason 来分析智能汽车的行为。此外,Uber 还在对 Cosmos Reason 进行后训练,以总结视觉数据并分析行人穿行高速公路等场景,进而执行质量分析并指导辅助驾驶行为。

Cosmos Reason 也可以作为智能汽车的“大脑”。它让机器人能够解读环境,在接收到复杂指令时将其分解为任务,并使用常识去执行任务,即便在陌生环境中也是如此。

Centific正在测试 Cosmos Reason,以增强其 AI 赋能的视频智能平台。运用 VLM,该平台能够将复杂的视频数据处理为可供行动参考的见解,帮助减少误报并提高决策制定的效率。

VAST正采用 NVIDIA Cosmos Reason 及其 AI 操作系统来大规模处理海量视频流,推动实时城市智能发展。借助 VSS Blueprint,VAST 可构建能够识别突发事件并触发响应的智能体,将视频流和元数据转化为可操作的主动式公共安全工具。

Ambient.ai正使用 Cosmos Reason 的时间物理感知推理,自动检测丢失的个人防护设备并监测危险状况,帮助改善建筑、制造、物流和其他工业环境中的环境健康与安全。

Magna正在将 Cosmos Reason 集成至其 City Delivery Platform(一个高度自主、低成本即时配送解决方案),帮助车辆更快地适应新城市。该模型为车辆的长期轨迹规划增添了对世界的理解能力。

这些模型预计将以 NVIDIA NIM 的形式提供,以便安全可靠地部署到任意 NVIDIA 加速基础设施上,更大限度地提高隐私性和控制力。这些模型计划不久后通过 Amazon Bedrock 和 Amazon SageMaker AI (用于 Nemotron 模型),以及 Azure AI Foundry、Oracle Data Science Platform 和 Google Vertex AI 发布。

您可在 NVIDIA 官网上试用 Cosmos Reason,或通过 Hugging Face 和 GitHub 下载。

Nemotron Nano 2 和 Llama Nemotron Super 1.5 (NVFP4) 将在不久后开放下载。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5685

    浏览量

    110111
  • AI
    AI
    +关注

    关注

    91

    文章

    41050

    浏览量

    302557
  • 模型
    +关注

    关注

    1

    文章

    3814

    浏览量

    52261

原文标题:SIGGRAPH 2025 | 全球行业先驱利用NVIDIA Nemotron和Cosmos推理模型,为企业构建AI智能体

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【2025夏季班正课】大模型Agent智能开发实战 课分享

    往往只关注模型能否生成正确的回复,却忽视了生产环境中的稳定性保障。体系化开发要求引入严格的工程化标准。这包括构建完善的评测体系,利用自动化测试框架对智能
    发表于 03-29 16:12

    NVIDIA开放模型助力构建下一代数字健康智能

    NVIDIA Nemotron 系列开放模型NVIDIA NeMo 库正在为临床医生、研究人员和开发者提供开放权重和方法,使他们能够在自有的基础设施上构建和部署定制化的数字健康
    的头像 发表于 03-25 09:46 406次阅读

    NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展

    新闻摘要: ●NVIDIA Nemotron 3 全模态理解模型 (Omni-understanding Models) 为 AI 智能
    的头像 发表于 03-17 09:18 501次阅读
    <b class='flag-5'>NVIDIA</b> 扩展开放<b class='flag-5'>模型</b>系列,推动代理式、物理和医疗 <b class='flag-5'>AI</b> 下一阶段发展

    NVIDIA推出代理式AI蓝图与电信推理模型

    借助全新开源大型电信模型NVIDIA Blueprint,电信运营商能够利用自有数据训练 AI 智能
    的头像 发表于 03-06 17:37 3060次阅读

    阿里巴巴发布通义千问旗舰推理模型Qwen3-Max-Thinking

    今天,我们正式发布千问旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录。
    的头像 发表于 01-27 15:47 578次阅读
    阿里巴巴发布通义千问旗舰<b class='flag-5'>推理模型</b>Qwen3-Max-Thinking

    LLM推理模型是如何推理的?

    这篇文章《(How)DoReasoningModelsReason?》对当前大型推理模型(LRM)进行了深刻的剖析,超越了表面的性能宣传,直指其技术本质和核心局限。以下是基于原文的详细技术原理、关键
    的头像 发表于 01-19 15:33 690次阅读
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    NVIDIA 推出 Alpamayo 系列开源 AI 模型与工具,加速安全可靠的推理型辅助驾驶汽车开发

    新闻摘要 : l NVIDIA 率先发布为应对辅助驾驶长尾场景挑战而设计的开源视觉-语言-动作推理模型(Reasoning VLA);NVIDIA Alpamayo 系列还包含赋能辅助驾驶汽车开发
    的头像 发表于 01-06 09:40 511次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo 系列开源 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>与工具,加速安全可靠的<b class='flag-5'>推理</b>型辅助驾驶汽车开发

    NVIDIA推动面向数字与物理AI的开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA) NVIDIA DRI
    的头像 发表于 12-13 09:50 1528次阅读

    NVIDIA Nemotron如何助力企业构建专业AI智能

    随着代理式 AI 的日益普及,开源模型与工具日趋成熟,各行业企业都在思考:我们该构建怎样的 AI 智能
    的头像 发表于 12-13 09:14 921次阅读

    什么是AI模型推理能力

    NVIDIA 的数据工厂团队为 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face
    的头像 发表于 09-23 15:19 1456次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的头像 发表于 08-27 12:45 2001次阅读
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理模型</b>发布

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企业级 A
    的头像 发表于 08-14 11:34 1539次阅读

    基于NVIDIA Llama Nemotron Super v1.5模型构建AI智能

    AI 智能体现在已经能够解决多步骤问题、编写生产级代码并在多个领域担任通用助手。但要充分发挥其潜力,还需要在控制成本的前提下加入先进的逻辑推理模型
    的头像 发表于 08-05 16:17 1574次阅读
    基于<b class='flag-5'>NVIDIA</b> Llama Nemotron Super v1.5<b class='flag-5'>模型</b><b class='flag-5'>构建</b><b class='flag-5'>AI</b><b class='flag-5'>智能</b><b class='flag-5'>体</b>

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    模态的技术特性,DeepSeek正加速推动AI在金融、政务、科研及网络智能化等关键领域的深度应用。 信而泰:AI推理引擎赋能网络智能诊断新范
    发表于 07-16 15:29

    企业使用NVIDIA NeMo微服务构建AI智能平台

    已发布的 NeMo 微服务可与合作伙伴平台集成,作为创建 AI 智能构建模块,使用商业智能与强大的逻辑
    的头像 发表于 04-27 15:05 1477次阅读