0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Jetson模型赋能AI在边缘端落地

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2026-03-16 16:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron、Cosmos 和 Isaac GR00T 等模型以及千问大模型、Gemma、Mistral AI、GPT-OSS、PI 等社区模型的通用平台。

Cat 306 CR小型挖掘机重约八吨,尺寸紧凑,可以装进标准集装箱。当工地空间有限时,例如在建筑物附近挖掘公用设施沟渠或在密集城区挖掘地下室,承包商会租用这种设备。

它的驾驶室空间接近电话亭大小,操作员需要身体靠近控制台,双手各握两个操纵杆。这套系统具有一定的学习门槛。

在今年初的 CES 展会上,这款机器已经能够回答问题了。

在演示中,Cat AI Assistant 运行在NVIDIA Jetson Thor平台上。该平台是一个为工业和机器人系统设计的实时推理边缘 AI 平台。为了实现快速准确的自然语音交互,该系统采用了NVIDIA Nemotron语音模型,同时借助 Qwen3 4B,可以通过 vLLM 本地服务,确保无云连接的情况下,以低延迟解析请求并生成响应。

除了推动企业创新,开放模型还为开发者开辟了自由构建与实验的广阔空间。通过在 NVIDIA Jetson 上运行 OpenClaw,开发者可打造个人全天候在线的边缘 AI 助手。不仅能零成本调用 API,还能确保完整的数据隐私。

所有 Jetson 开发套件均支持 OpenClaw,用户能够灵活切换 20 亿至 300 亿参数规模的开放模型。凭借本地运行的前沿级 AI 助手,用户可实时处理晨间简报、自动化日常任务、进行代码审查并控制智能家居系统——全部在本地实时完成。

从云端到边缘

在过去一段时间,开放模型通常部署在最容易提供支持的环境中。

它们运行在数据中心,依赖弹性计算和持续稳定的网络连接提供支撑。然而,云部署会带来延迟成本和持续的计算成本,且这些成本会随着每次查询线性增长。

而物理系统的优化重点则不同。它们需要低延迟,因为机器必须与人和环境实时互动;需要功耗受控,以适应设备的硬件限制;以及稳定一致的行为,因为任何不确定性都会带来风险。

此外,还存在供应层面的问题。内存短缺推高了全行业的成本。Jetson 通过将计算单元与内存集成于单个系统级模块 (SoM) 中,不仅加速了客户的硬件设计进程,也使元器件采购与验证比采用分立方案更为高效可靠。

与此同时,随着模型效率不断提升,开发者也开始提出一个更本质的问题:不再纠结“哪个模型单独性能最强”,而是思考“它在哪里运行才最合理”。

如今,答案越来越明确地指向设备端。例如,入门级生成式 AI 模型可从 Jetson Orin Nano 8GB 起步。

大规模构建自主物理 AI 系统

对物理AI系统而言,生成式 AI 模型正在显著拓展能力边界。

卡特彼勒正在开发的驾驶舱内 Cat AI 助手,可在本地同时运行语音与语言模型,并结合可信的机器上下文,为操作员提供指导与安全辅助功能。

在 CES 上,Franka Robotics 展示了这一理念在机器人领域的实际应用:该公司 FR3 Duo 双臂系统在设备上端到端运行 NVIDIA GR00T N1.6 模型,从环境感知到动作执行,全程无需任务脚本。控制策略完全在本地运行。

在机器人研究领域,NVIDIA GEAR 实验室的 SONIC 项目利用超过 1 亿帧的动作捕捉数据训练人形机器人控制器,随后将所得策略部署到实体机器人上。其中,运动学规划器在Jetson Orin上运行,单次推理仅需约 12 毫秒,策略控制环路以 50 Hz 频率稳定运行。所有计算均在设备本地完成。

这一范式也延伸至开发者社区。来自伊利诺伊大学香槟分校 (UIUC) SIGRobotics 社团的一支团队,借助在 Jetson Thor 上运行的 GR00T N1.5 模型,打造了一台双臂抹茶制作机器人,并在 NVIDIA 具身 AI 黑客松中荣获第一名。

纽约大学机器人与具身智能中心也在持续推动这一方向的研究。该团队近期在 Jetson Thor 上运行其YOR 机器人,借助 NVIDIA Blackwell 架构的强大算力处理 AI 驱动运动所需的复杂计算任务。初步结果显示,YOR 能够执行精细的抓取与放置任务,在面对新物体和场景变化时展现出更强的泛化能力与稳定性,从而加速其在烹饪、洗衣等家庭场景中的应用进程。

独立研究者也得出了相似结论。Hugging Face 多模态研究负责人 Andrés Marafioti 在Jetson AGX Orin 上构建了一个代理式 AI 系统,能够跨模型调度任务并自主安排工作流。某天深夜,该智能体给他发了一条消息:“去睡觉吧,一切明早都会准备好。”

Collabnix 社区的开发者 Ajeet Singh Raina 展示了如何在 NVIDIA Jetson Thor 上运行OpenClaw,打造一个全天候运行的个人 AI 助手。该配置支持用户对其自有数据进行私有化的大语言模型推理,同时通过本地网关管理电子邮件和日历。

Jetson 正成为新标准

NVIDIA Jetson 已成为在边缘端运行开放模型的通用平台。

它全面支持各类开放模型与 AI 框架,开发者可在边缘端灵活部署几乎任何生成式 AI 工作负载。

wKgZO2m3vyaAYEbAAAC6pxsb-qY253.png

模型基准测试可在Jetson AI Lab获取,也可查看开放模型社区提供的详细教程。Jetson Thor 在所有主流生成式 AI 模型上均提供领先的推理性能。

Gemma:基于 Google Gemini 研究成果打造,Gemma 3 是 Jetson 平台上的一款多功能主力模型。它原生支持多模态,意味着能“看”并“说”超过 140 种语言。在 Jetson Thor 上,它可处理高达 128K 的上下文窗口,非常适合需要记忆一长串复杂或多步骤指令的机器人应用。

gpt-oss-20B:这款来自 OpenAI 的模型通过在 Jetson Thor 和 Orin 上本地运行,即可提供接近顶尖水平的推理性能,显著降低了先进 AI 的部署门槛,实现高性价比推理。

Mistral AI:全新的 Mistral 3 开放模型系列为开发者和企业提供了业界领先的准确性、效率与定制能力。该系列包含从 3B 到 14B 参数的小型密集模型,体积小巧却异常智能。Jetson 开发者可使用 NVIDIA Jetson Thor 上的 vLLM 容器,在单并发场景下实现每秒 52 个 token 的生成速度,在八并发时可达每秒 273 个 token。

NVIDIA Cosmos:该领先开放推理视觉语言模型,使机器人和 AI 智能体能够像人类一样在物理世界中看见、理解并行动。其 8B 和 2B 版本均可在 Jetson 上高效运行,提供先进的时空感知与推理能力。

NVIDIA Isaac GR00TN1.6:一款面向通用机器人技能的开放视觉语言动作模型 (VLA)。开发者可用它构建能感知环境、理解指令并在多种任务、环境和机器人形态中执行动作的机器人。在 Jetson Thor 上,完整的 GR00T N1.6 管线可在设备端本地运行,实现实时感知、空间理解与快速响应。

NVIDIA Nemotron:一套包含开放模型、数据集与技术组合,赋能用户构建高效、精准、专用的代理式 AI 系统,面向先进推理、编程、视觉理解、代理式任务、安全性、语音与信息处理等场景。Nemotron 3 Nano 9B 模型可在 Jetson Orin Nano Super 上基于 llama.cpp 高效运行,性能达每秒处理 9 个 token。

PI 0.5: Physical Intelligence 推出的 VLA 模型,使机器人能理解指令,并凭借强大的泛化能力与实时适应性,自主执行复杂的现实世界任务。NVIDIA Jetson Thor 可提供每秒 120 个动作 token 的输出,为低延迟、高响应性的物理 AI 部署提供强劲支持。

Qwen 3.5:阿里巴巴推出的系列模型 (包括最新 Qwen 3.5 版本),涵盖密集模型与混合专家 (MoE) 模型,在推理、编程、多模态理解和长上下文处理方面表现卓越。Jetson Thor 为千问系列模型提供了了优化性能,例如Qwen 3.5-35B-A3B模型可实现每秒处理 35 个 token 的推理速度,使实时交互成为可能。

任何开发者均可对这些模型进行微调,构建专用的物理 AI 智能体,并将其无缝部署到物理 AI 系统中。NVIDIA Jetson 平台全面支持 NVIDIA TRT、Llama.cpp、Ollama、vLLM、SGLang 等主流 AI 框架。

在 Jetson 上尝试部署开放模型

开发者可学习 Hugging Face 上的教程,例如《在Jetson 上部署开源视觉语言模型》,并观看最新直播演示。通过该教程,学习如何在 NVIDIA Jetson 上运行 OpenClaw。

欢迎参加GTC 2026,见证实际运行效果。NVIDIA 将展示开放模型如何从数据中心走向真实世界中的机器,将在“工业自主化的未来”专题讨论会上的深度分享相关洞察。

观看 NVIDIA 创始人兼首席执行官黄仁勋的GTC 主题演讲,并关注物理 AI、机器人与视觉 AI相关专场会议。

卡特彼勒技术亮点

NVIDIA Jetson Thor:面向工业与机器人系统的实时边缘 AI 推理平台

NVIDIA Riva:采用 Parakeet ASR 与 Magpie TTS 的语音 AI 框架

Qwen3 4B:用于意图解析与生成回复的轻量级大语言模型

vLLM:在边缘端实现高效 LLM 推理服务的运行时间

CatHelios:提供可信的设备上下文统一数据平台

NVIDIA Omniverse:面向工业工作流的数字孪生与仿真框架

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5725

    浏览量

    110290
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303072
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52341

原文标题:开放模型点燃 AI 热潮,NVIDIA Jetson 赋能 AI 在边缘端落地

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA AI正在各类应用来保护地球

    气候、环境保护、灾害监测和资源回收方面,NVIDIA AI 正在各类应用来保护地球。
    的头像 发表于 05-08 09:44 228次阅读

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    310P芯片的底层架构,深度剖析这款产品的技术细节、算力门槛及其实际产业落地中的真实价值。 一、176TOPS的产业门槛:为何这是边缘算力的新起点? AI硬件的核心指标始终是算力,但
    发表于 03-10 14:19

    如何在NVIDIA Jetson AGX Thor上部署1200亿参数大模型

    上一期介绍了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服务,以及使用 Chatbox 作为前端调用 vLLM 运行的模型(上期文章链接)。本期
    的头像 发表于 12-26 17:06 5383次阅读
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> AGX Thor上部署1200亿参数大<b class='flag-5'>模型</b>

    如何在NVIDIA Jetson平台上运行最新的开源AI模型

    小型、低功耗的边缘设备上运行先进的 AI 和计算机视觉工作流正变得越来越具有挑战性。机器人、智能摄像头和自主设备需要实时智能来感知、理解并做出反应,而无需依赖云端。NVIDIA
    的头像 发表于 12-24 10:38 2044次阅读
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b>平台上运行最新的开源<b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    NVIDIA Jetson AGX Thor Developer Kit开发环境配置指南

    NVIDIA Jetson AGX Thor 专为物理 AI 打造,与上一代产品 NVIDIA Jetson AGX Orin 相比,生成式
    的头像 发表于 11-08 09:55 7814次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> AGX Thor Developer Kit开发环境配置指南

    通过NVIDIA Jetson AGX Thor实现7倍生成式AI性能

    Jetson Thor 平台还支持多种主流量化格式,包括 NVIDIA Blackwell GPU 架构的新 NVFP4 格式,有助于进一步优化推理性能。该平台同时支持推测解码等新技术,为
    的头像 发表于 10-29 16:53 1783次阅读

    工业视觉网关:RK3576多路检测与边缘AI

    标签 + 位置标注,打通 MES/ERP/追溯 流程。 三、典型落地场景· AOI自动光学检测:多角度对比 + 边缘AI判定,降低 DPMO,提升 FPY。· 工序/装配监控:对漏装/错装/姿态异常进行实时
    发表于 10-16 17:56

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生态系统兼容的低功耗 AI 模块

    。它是开源硬件,我们已在线发布设计文档,包括原理图和接口定义。其异构计算架构兼容 NVIDIA Jetson Nano 接口标准,非常适合边缘计算、AI 推理、VR/AR、智能 NVR
    发表于 10-11 09:08

    此芯科技发布“合一”AI加速计划,边缘AI创新

    产品组合,覆盖从1.5B至32B参数规模的AI模型推理需求,满足工业、消费电子、智能终端等多样化场景的部署需求,推动AI技术从云端向边缘
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合一”<b class='flag-5'>AI</b>加速计划,<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>边缘</b>与<b class='flag-5'>端</b>侧<b class='flag-5'>AI</b>创新

    研华科技推出基于NVIDIA Jetson Thor平台的边缘AI新品MIC-743

    研华重磅推出基于NVIDIA Jetson Thor平台的边缘AI新品 MIC-743,这款突破性产品以高达2070 FP4 TOPS的AI
    的头像 发表于 08-29 14:53 2504次阅读

    NVIDIA Jetson AGX Thor开发者套件重磅发布

    开发者与未来创造者们,准备好迎接边缘AI的史诗级革新了吗?NVIDIA以颠覆性技术再次突破极限,正式推出Jetson AGX Thor开发者套件!作为继传奇产品
    的头像 发表于 08-28 14:31 1847次阅读

    图为科技锚定具身智能新时代:NVIDIA Jetson引领边缘计算融合创新

    图为科技锚定具身智能新时代:NVIDIA Jetson引领边缘计算融合创新  7 月 22 日,由图为科技主办的“边缘计算
    的头像 发表于 08-11 16:39 1085次阅读
    图为科技锚定具身智能新时代:<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b>引领<b class='flag-5'>边缘</b>计算融合创新

    NVIDIA Jetson AGX Thor开发者套件概述

    TFLOPS 的 AI 计算性能,从而轻松运行最新的生成式 AI模型,且功耗不超过 130 W。与 NVIDIA Jetson AGX O
    的头像 发表于 08-11 15:03 2156次阅读

    NVIDIA Jetson + Isaac SDK 人形机器人领域的方案详解

    组件 描述 硬件平台(Jetson系列) 面向边缘AI和机器人开发的SoC模块,搭载GPU + ARM CPU,支持多种传感器和AI模型
    的头像 发表于 07-30 16:05 4122次阅读

    Arm方案 基于Arm架构的边缘侧设备(树莓派或 NVIDIA Jetson Nano)上部署PyTorch模型

    本文将为你展示如何在树莓派或 NVIDIA Jetson Nano 等基于 Arm 架构的边缘侧设备上部署 PyTorch 模型
    的头像 发表于 07-28 11:50 3181次阅读