0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

世界最小嵌入式AI超级计算机Jetson Xavier NX

星星科技指导员 来源:NVIDIA 作者:Dustin 2022-04-18 10:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 发布了Jetson Xavier NX,这是世界上最小、最先进的嵌入式 AI 超级计算机,用于自主机器人和边缘计算设备。Jetson Xavier NX 能够在紧凑的 70x45mm 外形尺寸中部署服务器级性能,在 15W 功率下提供高达 21 TOPS 的计算,或在 10W 下提供高达 14 TOPS 的计算。Jetson Xavier NX 模块(图 1)与 Jetson Nano 引脚兼容,并基于 NVIDIA 的 Xavier SoC 的低功耗版本,该版本在边缘 SoC 中领先于最近的MLPerf Inference 0.5结果,为部署要求苛刻的基于 AI 的边缘的工作负载可能会受到尺寸、重量、功率和成本等因素的限制。

pYYBAGJcyEaAO14YAAE37EgmMPI570.png

图 2:Jetson Xavier NX 处理器引擎的框图,包括高速 I/O 和内存结构。

如图 2 所示,Jetson Xavier NX 包括一个集成的 384 核 NVIDIA Volta GPU,具有 48 个 Tensor 核心、6 核 NVIDIA Carmel ARMv8.2 64 位 CPU、8GB 128 位 LPDDR4x、双 NVIDIA 深度学习加速器 (NVDLA)引擎、4K 视频编码器和解码器、用于多达 6 个同步高分辨率传感器流的专用摄像头摄取、PCIe Gen 3 扩展、双 DisplayPort/HDMI 4K 显示器、USB 3.1 和 GPIO,包括 SPI、I2C、I2S、CAN 总线和UART。请参阅下表 1,了解功能列表和Jetson Xavier NX 模块数据表,了解完整规格。共享内存结构允许处理器自由共享内存,而不会产生额外的内存副本(称为 ZeroCopy),从而有效地提高了系统的带宽利用率和吞吐量。

pYYBAGJcyGeAd4WAAAChc7VjUeE693.png

表 1:Jetson Xavier NX 计算模块特性和功能

* CPU 最大工作频率在 4/6 核模式下为 1400MHz,或在双核模式下为 1900MHz

† 最大并发流数达到总吞吐量。支持的视频编解码器:H.265、H.264、VP9有关特定编解码器和配置文件规范,

请参阅Jetson Xavier NX 模块数据表。

†† MIPI CSI-2,D-PHY V1.2(每通道 2.5Gb/s,总计高达 30Gbps)。

‡ PCIe 1×1 仅支持根端口,1×1/2/4 支持根端口或端点模式

^ 工作温度范围,Xavier SoC 结温 (Tj)

Jetson Xavier NX 得到 NVIDIA 完整的 CUDA-X 软件堆栈和用于 AI 开发的JetPack SDK的支持,除了实时计算机视觉、加速图形和丰富的多媒体应用程序之外,还能在多个高分辨率传感器流上同时运行流行的机器学习框架和复杂的 DNN在完整的桌面 Linux 环境中。Jetson 与 NVIDIA 的 AI 加速计算平台的兼容性使得开发和云与边缘之间的无缝迁移变得容易。

Jetson Xavier NX 模块将于 2020 年 3 月以 399 美元的批量供货,嵌入式设计人员可以参考可供下载的设计资料,包括Jetson Xavier NX 设计指南,为 Jetson Xavier NX 模块创建生产设备和系统。与 Jetson Nano 的引脚兼容性允许共享设计和对 Jetson Xavier NX 的直接技术插入升级。Jetson 生态系统的硬件设计合作伙伴除了提供现成的载体、传感器和配件外,还能够提供定制设计服务和系统集成。

软件开发人员现在可以开始为 Jetson Xavier NX 构建 AI 应用程序,方法是使用 Jetson AGX Xavier 开发工具包,并将设备配置补丁应用到 JetPack,使设备表现得像 Jetson Xavier NX。除了设置整个系统的核心时钟频率和电压外,它还将通过软件改变可用的 CPU 和 GPU 核心的数量。该补丁是完全可逆的,可用于在硬件可用之前估算 Jetson Xavier NX 的性能。

Jetson Xavier NX 定义了 10 和 15W 的默认功率模式,根据活动模式实现 14 到 21 TOPS 的峰值性能。用于管理电源配置文件的 nvpmodel 工具调整 CPU、GPU、内存控制器和其他 SoC 时钟的最大时钟频率,以及在线 CPU 集群的数量——这些设置显示在表 2 中,用于预定义的 10W 和Jetson Xavier NX 的 15W 模式。CPU 布置在三个集群中,每个集群有 2 个内核,在 4/6 核模式下的最高工作频率为 1400MHz,在双核模式下最高可达 1900MHz,适用于可能需要更多单线程与多线程的应用程序表现。

poYBAGJcyHKAZGpiAABMKO7O-zY213.png

表 2:Jetson Xavier NX 在 10W 和 15W 功率模式下的最大工作频率和核心配置。

* 使用 NVDLA 时,GPU 最高工作频率为 600MHz(10W 模式)和 1000MHz(15W 模式)

根据工作负载,动态电压和频率缩放 (DVFS) 调节器在运行时将频率缩放到活动 nvpmodel 定义的最大限制,因此在空闲时降低功耗并取决于处理器利用率。nvpmodel 工具还可以根据应用要求和 TDP 轻松创建和自定义新的电源模式。可以编辑电源配置文件并将其添加到 /etc/nvpmodel.conf 配置文件中,并且在 Ubuntu 状态栏中添加了一个 GUI 小部件,以便在运行时轻松管理和切换电源模式。

深度学习推理基准

NVIDIA 还宣布,它在MLPerf Inference 0.5基准测试的 5 个类别中的 4 个类别中夺冠,其中 Jetson AGX Xavier 是边缘计算 SoC 的领导者,包括所有基于视觉的任务:使用 Mobilenet 进行图像分类和ResNet-50,以及使用 SSD-Mobilenet 和 SSD-ResNet 进行对象检测。在 MLPerf 定义的所有五项推理测试中,NVIDIA GPU 是十种竞争芯片架构中唯一提交结果的一种。

为了参考 Jetson 系列成员之间的可扩展性,我们还在流行的 DNN 模型上测量了 Jetson Nano、Jetson TX2、Jetson Xavier NX 和 Jetson AGX Xavier 的推理性能,用于图像分类、对象检测、姿势估计、分割等。这些结果(如下图 3 所示)是使用 JetPack 和 NVIDIA 的 TensorRT 推理加速器库运行的,该库可优化网络以实现实时性能,这些网络在 TensorFlow、PyTorch、Caffe、MXNet 等流行的机器学习框架中进行了训练。

pYYBAGJcyEiAcUKjAADDhGorRsA431.png

图 3. Jetson 系列中使用 TensorRT 的各种基于视觉的 DNN 模型的推理性能。

Jetson Xavier NX 的性能比 Jetson TX2 高出多达 10 倍,功率相同,占用空间减少 25%。在这些基准测试中,每个平台都以最高性能运行(Jetson AGX Xavier 为 MAX-N 模式,Xavier NX 和 TX2 为 15W,Nano 为 10W)。最大吞吐量是在批处理大小不超过 16 毫秒延迟阈值的情况下获得的,否则对于平台超过此延迟阈值的网络,批处理大小为 1。这种方法在实时应用程序的确定性低延迟要求和多流用例场景的最大性能之间提供了平衡。

在 Jetson Xavier NX 和 Jetson AGX Xavier 上,NVDLA 引擎和 GPU 以 INT8 精度同时运行,而在 Jetson Nano 和 Jetson TX2 上,GPU 以 FP16 精度运行。Jetson Xavier NX 中带有 Tensor Cores 的 Volta 架构 GPU 能够进行高达 12.3 TOPS 的计算,而该模块的 DLA 引擎每个可产生高达 4.5 TOPS。

除了使用 TensorRT 运行神经网络之外,ML 框架还可以通过 CUDA 和 cuDNN 本地安装在 Jetson 上,包括 TensorFlow、PyTorch、Caffe/Caffe2、MXNet、Keras 等。除了 AWS Greengrass 等物联网框架和 Docker 和 Kubernetes 等容器引擎之外, Jetson Zoo还包括预构建的安装程序和构建说明。

开发突破性的人工智能产品

Jetson Xavier NX 为部署下一代自主系统和智能边缘设备开辟了新的机会,这些设备需要高性能 AI 和复杂的 DNN 在小尺寸、低功耗的足迹中——想想移动机器人无人机、智能相机、便携式医疗设备、嵌入式物联网系统等等。支持 CUDA-X 的 NVIDIA JetPack SDK 提供了完整的工具来开发尖端的 AI 解决方案,并以世界领先的性能在云和边缘之间扩展您的应用程序。

关于作者

Dustin 是 NVIDIA Jetson 团队的一名开发人员推广员。Dustin 拥有机器人技术和嵌入式系统方面的背景,喜欢在社区中提供帮助并与 Jetson 合作开展项目。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30579

    浏览量

    219434
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296319
  • 无人机
    +关注

    关注

    234

    文章

    11137

    浏览量

    193205
  • 嵌入式AI
    +关注

    关注

    0

    文章

    37

    浏览量

    1408
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式系统的定义和应用领域

    嵌入式系统,简而言之,就是一种专为特定设备或装置设计的计算机系统。它们通常配备一个嵌入式处理器,其控制程序被存储在ROM中。这些系统在许多日常用品中都有广泛的应用,例如手表、微波炉、录像机和汽车等
    发表于 11-17 06:49

    嵌入式计算机AF208:自动化装配管理集成方案核心

    在高度自动化的现代汽车装配线上,控制中心的嵌入式计算机扮演着“神经中枢”的角色。当前,汽车制造企业自动化装配管理面临以下痛点:生产设备(机械臂、传送带、焊接机器人)之间难以协同、生产状态不透明导致
    的头像 发表于 10-16 10:15 267次阅读
    <b class='flag-5'>嵌入式计算机</b>AF208:自动化装配管理集成方案核心

    3C智造的核心:杰和嵌入式计算机AE613筑牢可靠基石

    嵌入式计算机提供核心支撑。杰和科技基于英特尔13代Core i3/i5处理器打造的嵌入式计算机AE613,正是为应对这些挑战而设计的智能产线基座。
    的头像 发表于 09-29 16:46 1752次阅读
    3C智造的核心:杰和<b class='flag-5'>嵌入式计算机</b>AE613筑牢可靠基石

    军用导航领域嵌入式计算机分析

    在导航系统中,嵌入式计算机的核心作用是实时处理多种传感器的数据,运行复杂的导航算法,最终计算出载体的精确位置、姿态、速度和时间信息。
    的头像 发表于 09-26 16:52 802次阅读

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 E
    的头像 发表于 07-28 15:07 911次阅读

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC 和 AI
    的头像 发表于 06-12 15:33 1033次阅读

    市场上主流的端侧AI MPU 大全

    当前市场上主流的端侧AI MPU(Micro Processing Unit,微处理器)品牌及型号盘点,涵盖不同应用场景(如物联网、边缘计算嵌入式设备等)的芯片选择: ‌ 1. 国际品牌
    的头像 发表于 04-02 17:44 3288次阅读

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算嵌入式开发

    RZ/V2N——近期在嵌入式世界2025上新发布,为 AI 计算嵌入式系统及工自动化提供强大支持。这款全新的
    发表于 03-19 17:54

    NVIDIA 宣布推出 DGX Spark 个人 AI 计算机

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制造商(包括华硕、Dell Technolog
    发表于 03-19 09:59 502次阅读
       NVIDIA 宣布推出 DGX Spark 个人 <b class='flag-5'>AI</b> <b class='flag-5'>计算机</b>

    NVIDIA推出个人AI超级计算机Project DIGITS

    NVIDIA 推出个人 AI 超级计算机 NVIDIA Project DIGITS,全球的 AI 研究员、数据科学家和学生都可获取 NVIDIA Grace Blackwell 平台
    的头像 发表于 01-08 11:03 1159次阅读

    飞凌嵌入式获批建设「河北省嵌入式计算机控制系统技术创新中心」

    河北省科学技术厅公示了2024年度拟新建省重点实验室和省技术创新中心的名单,保定飞凌嵌入式技术有限公司(以下简称:飞凌嵌入式)作为“河北省嵌入式计算机控制系统技术创新中心”的依托单位成功上榜,成为新建的135家省技术创新中心之一
    的头像 发表于 12-27 10:45 1037次阅读
    飞凌<b class='flag-5'>嵌入式</b>获批建设「河北省<b class='flag-5'>嵌入式计算机</b>控制系统技术创新中心」

    NVIDIA发布高性价比生成AI超级计算机

    NVIDIA近日推出了一款全新的生成AI超级计算机——Jetson Orin Nano Super开发者套件,这款
    的头像 发表于 12-24 10:44 1005次阅读

    NVIDIA 推出高性价比的生成 AI 超级计算机

    计算机,具有更高的性价比,通过软件升级即可实现性能提升。   全新 NVIDIA Jetson Orin Nano Super 开发者套件只有手掌大小,能够为商业 AI 开发者、科技爱好者和学生等各类
    发表于 12-18 17:01 948次阅读
    NVIDIA 推出高性价比的生成<b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的
    的头像 发表于 12-17 10:19 932次阅读

    新手怎么学嵌入式?

    基本的概念。嵌入式系统是一种将计算机技术嵌入到特定设备中的系统,它通常具有特定的功能和有限的资源。你需要学习一些计算机基础知识,如数据结构、操作系统、
    发表于 12-12 10:51