0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA JetPack 6.2引入Super模式

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-02-12 09:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA Jetson Orin Nano Super 开发者套件的推出开创了小型边缘设备生成式 AI 的新时代。全新的 Super 模式为生成式 AI 性能带来了空前的提升,最多可提升至 1.7 倍,使其成为高性价比的生成式 AI 超级计算机。

JetPack 6.2 现已支持 Jetson Orin NanoJetson Orin NX 生产模组通过 Super 模式实现性能升级,最多可将生成式 AI 性能提升至 2 倍。现在,您可以为新的和现有的机器人和边缘 AI 应用释放更多价值并降低总体拥有成本。

本文将详细介绍 Super 模式的详细信息,包括新的功率模式、Jetson Orin Nano 和 Orin NX 模组上常用生成式 AI 模型的基准性能、文档更新情况以及支持 Super 开发者套件的 NPN 合作伙伴。

Jetson Orin Nano 和Jetson Orin NX 系列的新参考功率模式

JetPack 6.2 通过在 GPU、DLA 内存和 CPU 时钟上解锁更高的频率,提升 Jetson Orin Nano 和 Jetson Orin NX 系列的功耗。

9342a476-e85d-11ef-9310-92fbcf53809c.png

表 1. Jetson Orin Nano 和 Jetson Orin NX 模组的新参考功率模式

Jetson Orin Nano 模组现在有 25W 模式和无功率上限的全新 MAXN SUPER 模式。同样,Jetson Orin NX 模组现在可以使用新的 40W 参考功率模式以及无功率上限的 MAXN SUPER 模式。

MAXN SUPER 是一种无功率上限的功率模式,所支持的 CPU、GPU、DLA、PVA 和 SOC 引擎核数量和时钟频率最高。在该模式下,如果模组总功率超过热设计功率(TDP)上限,系统会将模组调低频率,通过降低性能将功率控制在热上限内。

我们强烈建议您建立自己的自定义功率模式,以便在功耗或热稳定性与性能之间找到适合您的应用和需求的合适平衡点。

表 2 比较了 Jetson Orin Nano 4GB 和 8GB 以及 Jetson Orin NX 8GB 和 16GB 在原始模式和 Super 模式下的详细规格。

934d71f8-e85d-11ef-9310-92fbcf53809c.png

表 2. Jetson Orin Nano 和 Jetson Orin NX 在原始模式和 Super 模式下的规格

在使用新的功率模式时,请确保产品当前或新的热设计能够适应功率模式的新规格。

最新功耗估算器工具

功耗估算器工具是 NVIDIA 提供的一个功能强大的工具,它可通过修改系统参数(例如 GPU、CPU、DLA 等的核数、最高频率和负载水平)创建自定义功耗配置文件和 nvpmodel 配置文件。该工具能够估算各种设置下的功耗,在需要平衡性能和功耗时可用于创建满足需求的最佳参数设置。

我们已在功耗估算器工具中增加了 Super 模式。我们强烈建议您在部署高性能应用之前使用功耗估算器工具并进行实际验证。

常用生成式 AI 模型的性能提升情况

在通过 JetPack 6.2 引入 Super 模式后,Jetson Orin Nano 和 Jetson Orin NX 模组的推理性能最多可提升至 2 倍。我们对最常用的大语言模型(LLM)、视觉语言模型(VLM)和视觉转换器(ViT)进行了基准测试。

大语言模型

下图和表格显示了 Llama3.1 8B、Qwen2.5 7B 和 Gemma2 2B 等常用 LLM 在 Super 模式下的性能基准。

9361fcae-e85d-11ef-9310-92fbcf53809c.png

图 1. 使用 Super 模式时的 LLM 性能提升情况

DNR 表示模组内存不足以运行特定模型。模型性能会受到节流行为的影响。

下表中的 LLM 生成性能(每秒 token 数)使用 MLC API 进行 INT4 量化后测量得出。

表 3 显示了JetPack 6.2 为 Jetson Orin Nano 4GB 上的 LLM 所带来的性能提升。

936caef6-e85d-11ef-9310-92fbcf53809c.png

表 3. Jetson Orin Nano 4GB 上常用 LLM 的基准性能(token/秒)

表 4 显示了 JetPack 6.2 为 Jetson Orin Nano 8GB 上的 LLM 所带来的性能提升。

9377a0b8-e85d-11ef-9310-92fbcf53809c.png

表 4. Jetson Orin Nano 8GB 上常用 LLM 的基准性能(token/秒)

表 5 显示了 JetPack 6.2 为 Jetson Orin NX 8GB 上的 LLM 所带来的性能提升。

9381999c-e85d-11ef-9310-92fbcf53809c.png

表 5. Jetson Orin NX 8GB 上常用 LLM 的基准性能(token/秒)

表 6 显示了 JetPack 6.2 为 Jetson Orin NX 16GB 上的 LLM 所带来的性能提升。

938c1a84-e85d-11ef-9310-92fbcf53809c.png

表 6. Jetson Orin NX 16GB 上常用 LLM 的基准性能(token/秒)

视觉语言模型

下图和表格显示了 VILA1.5 8B、LLAVA1.6 7B 和 Qwen2 VL 2B 等常用 VLM 在 Super 模式下的性能基准。

9396d488-e85d-11ef-9310-92fbcf53809c.png

图 2. 使用 Super 模式运行时的 VLM 性能提升情况

DNR 表示模组内存不足以运行特定模型。模型性能会受到节流行为的影响。

表 7 显示了 JetPack 6.2 为 Jetson Orin Nano 4GB 上的 VLM 所带来的性能提升。

939faaf4-e85d-11ef-9310-92fbcf53809c.png

表 7. Jetson Orin Nano 4GB 上常用 VLM 的基准性能(token/秒)

表 8 显示了 JetPack 6.2 为 Jetson Orin Nano 8GB 上的 VLM 所带来的性能提升。

93a95d6a-e85d-11ef-9310-92fbcf53809c.png

表 8. Jetson Orin Nano 8GB 上常用 VLM 的基准性能(token/秒)

表 9 显示了 JetPack 6.2 为 Jetson Orin NX 8GB 上的VLM所带来的性能提升。

93b43faa-e85d-11ef-9310-92fbcf53809c.png

表 9. Jetson Orin NX 8GB 上常用 VLM 的基准性能(token/秒)

表 10 显示了 JetPack 6.2 为 Jetson Orin NX 16GB 上的 VLM 所带来的性能提升。

93be7c04-e85d-11ef-9310-92fbcf53809c.png

表 10. Jetson Orin NX 16 GB 上常用 VLM 的基准性能(token/秒)

所有 VILA 和 LLAVA 模型均使用 MLC 以 INT4 精度运行,其余模型使用 Hugging Face Transformer 以 FP4 精度运行。

视觉 Transformer

下图和表格显示了 CLIP、DINO 和 SAM2 等常用 ViT 在 Super 模式下的性能基准。

93c7c82c-e85d-11ef-9310-92fbcf53809c.png

图 3. 使用 Super 模式运行时的 ViT 性能提升情况

DNR 表示模组上的内存不足以运行特定模型。模型性能会受到节流行为的影响。

表 11 显示了 JetPack 6.2 为 Jetson Orin Nano 4GB 上的 ViT 所带来的性能提升。

93cfd210-e85d-11ef-9310-92fbcf53809c.png

表 11. Jetson Orin Nano 4GB 上常用 ViT 的基准性能(token/秒)

表 12 显示了 JetPack 6.2 为 Jetson Orin Nano 8GB 上的 ViT 所带来的性能提升。

93d8523c-e85d-11ef-9310-92fbcf53809c.png

表 12. Jetson Orin Nano 8GB 上常用 ViT 的基准性能(token/秒)

表 13 显示了 JetPack 6.2 为 Jetson Orin NX 8GB 上的 ViT 所带来的性能提升。

93e23b76-e85d-11ef-9310-92fbcf53809c.png

表 13. Jetson Orin NX 8GB 上常用 ViT 的基准性能(token/秒)

表 14 显示了 JetPack 6.2 为 Jetson Orin NX 16GB 上的 ViT 所带来的性能提升。

93eccba4-e85d-11ef-9310-92fbcf53809c.png

表 14. Jetson Orin NX 16GB 上常用 ViT 的基准性能(token/秒)

所有 ViT 模型均使用 NVIDIA TensorRT 以 FP16 精度运行,测量单位为 FPS。

开始使用搭载 JetPack 6.2 的NVIDIA Jetson Orin Nano和 Jetson Orin NX

NVIDIA Jetson 生态系统提供了多种使用 JetPack 镜像刷写开发者套件和生产模组的方式。

可使用以下任何一种方法在 Jetson Orin Nano 开发者套件或模组上安装 JetPack 6.2:

从 JetPack SDK 页面获得 SD 卡镜像:

https://developer.nvidia.com/embedded/jetpack

根据下载和安装说明,对 SDK Manager 进行刷写:

https://developer.nvidia.com/sdk-manager

根据刷写支持,刷写 bootloader、kernel 和 root file system 的脚本:

https://docs.nvidia.com/jetson/archives/r36.4.3/DeveloperGuide/SD/FlashingSupport.html#flashing-support

新的刷写配置

新功率模式仅适用于新的刷写配置。默认刷写配置没有改变。如要启用新功率模式,您必须在刷写时使用新的刷写配置。

下面是进行刷写时使用的新的刷写配置:

jetson-orin-nano-devkit-super.conf

刷写或更新到 JetPack 6.2 后,运行以下命令以启动新提供的 Super 模式。

在 Jetson Orin Nano 模组上启动 MAXN SUPER 模式:

sudo nvpmodel -m 2

在 Jetson Orin NX 模组上启动 MAXN SUPER 模式:

sudo nvpmodel -m 0

您还可以从页面右上角的功率模式菜单中选择 MAXN SUPER 和其他功率模式。

93f43c72-e85d-11ef-9310-92fbcf53809c.png

图 4. 功率模式选择菜单

Jetson AI Lab

Jetson AI 实验室是 NVIDIA 探索和试验针对边缘设备优化的生成式 AI 技术的中心。它为开发者提供支持并为合作社区提供近 50 种教程、预构建容器和资源,帮助社区使用经过优化的推理基础设施部署设备端 LLM、SLM、VLM、扩散策略和语音模型。

通过简化前沿 AI 工具的访问途径,该实验室使各级别的开发者都能在本地进行创新和部署生成式 AI,从而推动开源边缘 AI 和机器人学习的发展。

Jetson 生态系统合作伙伴为 Super 模式做好准备

为了帮助客户进行部署,Jetson 生态系统合作伙伴已通过增强自己的解决方案,支持这一轮性能提升。

9401ba64-e85d-11ef-9310-92fbcf53809c.png

NVIDIA Jetson Orin生命周期和路线图

由于客户对 Jetson Orin 的需求不断增长,NVIDIA 最近宣布将 Jetson Orin 的产品生命周期延长至 2032 年。经过这次的性能提升,Jetson Orin Nano 和 Orin NX 系列已成为当前和未来模型的理想平台。

即将发布的 JetPack 5.1.5 也将支持 Jetson Orin NX 和 Jetson Orin Nano 模组的 Super 模式。使用 JetPack 5 进行开发的开发者和客户将从性能提升中受益。

940c9894-e85d-11ef-9310-92fbcf53809c.png

图 5.JetPack 软件路线图

使用 JetPack 6.2提升应用性能

JetPack 6.2 是一个突破性的版本,它可在现有 Jetson 模组上实现惊人的 2 倍推理性能提升,且不会增加任何成本。对于希望提升应用性能的 Jetson 开发者和客户而言,此次升级必不可少。现在就升级到 JetPack 6.2,充分释放 Jetson 平台的潜力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30574

    浏览量

    219430
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222858
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109044
  • AI
    AI
    +关注

    关注

    89

    文章

    38077

    浏览量

    296300

原文标题:JetPack 6.2 为 Jetson Orin Nano 和 Jetson Orin NX 模组引入“Super”模式

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用AD16488A时,通过DIO4引入外部时钟,时钟频率为100Hz,会对最终传感器的输出有什么影响?

    请问在使用16488A时,通过DIO4引入外部时钟,时钟频率为100Hz,会对最终传感器的输出有什么影响?对数据就绪信号DRY有什么影响呢? 手册中看到了可能会造成角度变化的寄存器值溢出,但我用不到这个量。谢谢了!
    发表于 12-29 06:19

    NVIDIA Jetson的相关资料分享

    Jetson概述爆炸式增长的AI模型的复杂性专为自主机器开发人员设计的AI计算板加快AI处理的SDK“JetPack”概述NVIDIA Jetson是NVIDIA公司嵌入式单板计算机的一系列
    发表于 11-09 08:26

    NVIDIA将于7月2日发布Super显卡

    今儿就是6月21日了,可外媒小规模流传的NVIDIA 6月21日发布Super系列显卡的消息可谓不攻自破,现在看来整个6月都不可能。
    发表于 06-22 10:06 1383次阅读

    Super”或取代“Ti”成为NVIDIA显卡新的增强版型号后缀

    消息称,NVIDIA正密谋两款显卡新品,分别是GTX 1660 Super和GTX 1650 Super
    的头像 发表于 09-12 16:27 1.2w次阅读

    NVIDIA推出GTX 1660 Super显卡的消息确认

    NVIDIA即将推出GTX 1660 Super显卡早已是板上钉钉的事情,但具体时间、规格一直没有得到完全确认。
    的头像 发表于 10-14 14:53 4925次阅读

    消息称NVIDIA欲复活RTX 2060 Super产品线

    明明已经发布了RTX 3060 Ti/3060,后者也将在2月底上市发货。可最新消息称,NVIDIA欲重新复活RTX 2060和RTX 2060 Super产品线。据称NVIDIA已经开始向AIC
    的头像 发表于 01-21 16:23 2041次阅读
    消息称<b class='flag-5'>NVIDIA</b>欲复活RTX 2060 <b class='flag-5'>Super</b>产品线

    NVIDIA JetPack SDK AI应用程序指南

    NVIDIA JetPack SDKis是构建AI应用程序的最全面的解决方案。使用JetPackinstaller为您的Jetson开发人员工具包闪存最新的操作系统映像,为主机PC和开发人员工具包安装开发人员工具,并安装启动开发环境所需的库和api、示例和文档。
    发表于 04-06 16:09 0次下载
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>JetPack</b> SDK AI应用程序指南

    jetpack FreeBSD应用容器

    ./oschina_soft/jetpack.zip
    发表于 05-11 09:17 1次下载
    <b class='flag-5'>jetpack</b> FreeBSD应用容器

    NVIDIA JetPack SDK的主要功能

    NVIDIA JetPack SDK是构建 AI 应用的全面解决方案,支持所有 Jetson 模块和开发者套件。
    的头像 发表于 10-17 12:05 3932次阅读

    使用 NVIDIA DeepStream SDK 6.2 顺利开发视觉 AI 应用

    NVIDIA 宣布用于构建高性能视频分析和流式传输应用的人工智能(AI)分析工具套件  NVIDIADeepStream SDK 6.2 全面上市。此次更新增加了新的功能,包括改进后的多对象追踪器
    的头像 发表于 02-11 10:25 1646次阅读

    C++17引入的一个新特性void_t简析

    void_t是C++17引入的一个新特性,它的定义很简单(有些编译器的实现可能不是这样,但也大体类似)
    的头像 发表于 03-06 09:37 1688次阅读

    RTX 4070 Ti SUPER详细评测

    2024年1月9日,NVIDIA发布了GeForce RTX 40 SUPER系列显卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080
    发表于 01-29 10:31 6548次阅读
    RTX 4070 Ti <b class='flag-5'>SUPER</b>详细评测

    使用NVIDIA JetPack 6.0和YOLOv8构建智能交通应用

    本文将介绍如何使用 NVIDIA JetPack 6.0 中的全新 Jetson 平台服务,来构建一个适用于边缘的端到端交通分析解决方案。该系统集成了多个功能:使用视频存储工具包 (VST) 服务
    的头像 发表于 08-23 16:49 1464次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>JetPack</b> 6.0和YOLOv8构建智能交通应用

    NVIDIA JetPack 6.0版本的关键功能

    NVIDIA JetPack SDK 支持 NVIDIA Jetson 模块,为构建端到端加速 AI 应用提供全面的解决方案。JetPack 6 通过微服务和一系列新功能,扩展了 Je
    的头像 发表于 09-09 10:18 1481次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>JetPack</b> 6.0版本的关键功能

    解析NVIDIA JetPack 6.1的新功能

    NVIDIA JetPack一直在不断发展,通过提供量身定制的先进软件满足边缘 AI 和机器人开发者日益增长的需求。每次发布的 JetPack 新版本都会升级性能、加入新功能与优化现有工具,以便为
    的头像 发表于 11-28 10:41 1644次阅读
    解析<b class='flag-5'>NVIDIA</b> <b class='flag-5'>JetPack</b> 6.1的新功能