0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

世界最小嵌入式AI超级计算机Jetson Xavier NX

星星科技指导员 来源:NVIDIA 作者:Dustin 2022-04-18 10:09 次阅读

NVIDIA 发布了Jetson Xavier NX,这是世界上最小、最先进的嵌入式 AI 超级计算机,用于自主机器人和边缘计算设备。Jetson Xavier NX 能够在紧凑的 70x45mm 外形尺寸中部署服务器级性能,在 15W 功率下提供高达 21 TOPS 的计算,或在 10W 下提供高达 14 TOPS 的计算。Jetson Xavier NX 模块(图 1)与 Jetson Nano 引脚兼容,并基于 NVIDIA 的 Xavier SoC 的低功耗版本,该版本在边缘 SoC 中领先于最近的MLPerf Inference 0.5结果,为部署要求苛刻的基于 AI 的边缘的工作负载可能会受到尺寸、重量、功率和成本等因素的限制。

pYYBAGJcyEaAO14YAAE37EgmMPI570.png

图 2:Jetson Xavier NX 处理器引擎的框图,包括高速 I/O 和内存结构。

如图 2 所示,Jetson Xavier NX 包括一个集成的 384 核 NVIDIA Volta GPU,具有 48 个 Tensor 核心、6 核 NVIDIA Carmel ARMv8.2 64 位 CPU、8GB 128 位 LPDDR4x、双 NVIDIA 深度学习加速器 (NVDLA)引擎、4K 视频编码器和解码器、用于多达 6 个同步高分辨率传感器流的专用摄像头摄取、PCIe Gen 3 扩展、双 DisplayPort/HDMI 4K 显示器、USB 3.1 和 GPIO,包括 SPI、I2C、I2S、CAN 总线和UART。请参阅下表 1,了解功能列表和Jetson Xavier NX 模块数据表,了解完整规格。共享内存结构允许处理器自由共享内存,而不会产生额外的内存副本(称为 ZeroCopy),从而有效地提高了系统的带宽利用率和吞吐量。

pYYBAGJcyGeAd4WAAAChc7VjUeE693.png

表 1:Jetson Xavier NX 计算模块特性和功能

* CPU 最大工作频率在 4/6 核模式下为 1400MHz,或在双核模式下为 1900MHz

† 最大并发流数达到总吞吐量。支持的视频编解码器:H.265、H.264、VP9有关特定编解码器和配置文件规范,

请参阅Jetson Xavier NX 模块数据表。

†† MIPI CSI-2,D-PHY V1.2(每通道 2.5Gb/s,总计高达 30Gbps)。

‡ PCIe 1×1 仅支持根端口,1×1/2/4 支持根端口或端点模式

^ 工作温度范围,Xavier SoC 结温 (Tj)

Jetson Xavier NX 得到 NVIDIA 完整的 CUDA-X 软件堆栈和用于 AI 开发的JetPack SDK的支持,除了实时计算机视觉、加速图形和丰富的多媒体应用程序之外,还能在多个高分辨率传感器流上同时运行流行的机器学习框架和复杂的 DNN在完整的桌面 Linux 环境中。Jetson 与 NVIDIA 的 AI 加速计算平台的兼容性使得开发和云与边缘之间的无缝迁移变得容易。

Jetson Xavier NX 模块将于 2020 年 3 月以 399 美元的批量供货,嵌入式设计人员可以参考可供下载设计资料,包括Jetson Xavier NX 设计指南,为 Jetson Xavier NX 模块创建生产设备和系统。与 Jetson Nano 的引脚兼容性允许共享设计和对 Jetson Xavier NX 的直接技术插入升级。Jetson 生态系统的硬件设计合作伙伴除了提供现成的载体、传感器和配件外,还能够提供定制设计服务和系统集成。

软件开发人员现在可以开始为 Jetson Xavier NX 构建 AI 应用程序,方法是使用 Jetson AGX Xavier 开发工具包,并将设备配置补丁应用到 JetPack,使设备表现得像 Jetson Xavier NX。除了设置整个系统的核心时钟频率和电压外,它还将通过软件改变可用的 CPU 和 GPU 核心的数量。该补丁是完全可逆的,可用于在硬件可用之前估算 Jetson Xavier NX 的性能。

Jetson Xavier NX 定义了 10 和 15W 的默认功率模式,根据活动模式实现 14 到 21 TOPS 的峰值性能。用于管理电源配置文件的 nvpmodel 工具调整 CPU、GPU、内存控制器和其他 SoC 时钟的最大时钟频率,以及在线 CPU 集群的数量——这些设置显示在表 2 中,用于预定义的 10W 和Jetson Xavier NX 的 15W 模式。CPU 布置在三个集群中,每个集群有 2 个内核,在 4/6 核模式下的最高工作频率为 1400MHz,在双核模式下最高可达 1900MHz,适用于可能需要更多单线程与多线程的应用程序表现。

poYBAGJcyHKAZGpiAABMKO7O-zY213.png

表 2:Jetson Xavier NX 在 10W 和 15W 功率模式下的最大工作频率和核心配置。

* 使用 NVDLA 时,GPU 最高工作频率为 600MHz(10W 模式)和 1000MHz(15W 模式)

根据工作负载,动态电压和频率缩放 (DVFS) 调节器在运行时将频率缩放到活动 nvpmodel 定义的最大限制,因此在空闲时降低功耗并取决于处理器利用率。nvpmodel 工具还可以根据应用要求和 TDP 轻松创建和自定义新的电源模式。可以编辑电源配置文件并将其添加到 /etc/nvpmodel.conf 配置文件中,并且在 Ubuntu 状态栏中添加了一个 GUI 小部件,以便在运行时轻松管理和切换电源模式。

深度学习推理基准

NVIDIA 还宣布,它在MLPerf Inference 0.5基准测试的 5 个类别中的 4 个类别中夺冠,其中 Jetson AGX Xavier 是边缘计算 SoC 的领导者,包括所有基于视觉的任务:使用 Mobilenet 进行图像分类和ResNet-50,以及使用 SSD-Mobilenet 和 SSD-ResNet 进行对象检测。在 MLPerf 定义的所有五项推理测试中,NVIDIA GPU 是十种竞争芯片架构中唯一提交结果的一种。

为了参考 Jetson 系列成员之间的可扩展性,我们还在流行的 DNN 模型上测量了 Jetson Nano、Jetson TX2、Jetson Xavier NX 和 Jetson AGX Xavier 的推理性能,用于图像分类、对象检测、姿势估计、分割等。这些结果(如下图 3 所示)是使用 JetPack 和 NVIDIA 的 TensorRT 推理加速器库运行的,该库可优化网络以实现实时性能,这些网络在 TensorFlow、PyTorch、Caffe、MXNet 等流行的机器学习框架中进行了训练。

pYYBAGJcyEiAcUKjAADDhGorRsA431.png

图 3. Jetson 系列中使用 TensorRT 的各种基于视觉的 DNN 模型的推理性能。

Jetson Xavier NX 的性能比 Jetson TX2 高出多达 10 倍,功率相同,占用空间减少 25%。在这些基准测试中,每个平台都以最高性能运行(Jetson AGX Xavier 为 MAX-N 模式,Xavier NX 和 TX2 为 15W,Nano 为 10W)。最大吞吐量是在批处理大小不超过 16 毫秒延迟阈值的情况下获得的,否则对于平台超过此延迟阈值的网络,批处理大小为 1。这种方法在实时应用程序的确定性低延迟要求和多流用例场景的最大性能之间提供了平衡。

在 Jetson Xavier NX 和 Jetson AGX Xavier 上,NVDLA 引擎和 GPU 以 INT8 精度同时运行,而在 Jetson Nano 和 Jetson TX2 上,GPU 以 FP16 精度运行。Jetson Xavier NX 中带有 Tensor Cores 的 Volta 架构 GPU 能够进行高达 12.3 TOPS 的计算,而该模块的 DLA 引擎每个可产生高达 4.5 TOPS。

除了使用 TensorRT 运行神经网络之外,ML 框架还可以通过 CUDA 和 cuDNN 本地安装在 Jetson 上,包括 TensorFlow、PyTorch、Caffe/Caffe2、MXNet、Keras 等。除了 AWS Greengrass 等物联网框架和 Docker 和 Kubernetes 等容器引擎之外, Jetson Zoo还包括预构建的安装程序和构建说明。

开发突破性的人工智能产品

Jetson Xavier NX 为部署下一代自主系统和智能边缘设备开辟了新的机会,这些设备需要高性能 AI 和复杂的 DNN 在小尺寸、低功耗的足迹中——想想移动机器人无人机、智能相机、便携式医疗设备、嵌入式物联网系统等等。支持 CUDA-X 的 NVIDIA JetPack SDK 提供了完整的工具来开发尖端的 AI 解决方案,并以世界领先的性能在云和边缘之间扩展您的应用程序。

关于作者

Dustin 是 NVIDIA Jetson 团队的一名开发人员推广员。Dustin 拥有机器人技术和嵌入式系统方面的背景,喜欢在社区中提供帮助并与 Jetson 合作开展项目。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    26945

    浏览量

    201209
  • AI
    AI
    +关注

    关注

    87

    文章

    26307

    浏览量

    263905
  • 无人机
    +关注

    关注

    224

    文章

    9853

    浏览量

    174688
  • 嵌入式AI
    +关注

    关注

    0

    文章

    31

    浏览量

    774
收藏 人收藏

    评论

    相关推荐

    诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

    诺和诺德基金会携手英伟达,共同宣布在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动医疗保健、生命科学以及绿色转型等领域的科研与
    的头像 发表于 03-21 13:43 137次阅读

    什么是嵌入式计算机

    嵌入式计算机是一种专门设计用于特定功能的计算机系统,通常被嵌入到其他设备中,以执行特定的任务。这种计
    的头像 发表于 01-15 15:10 316次阅读
    什么是<b class='flag-5'>嵌入式计算机</b>?

    最适合 AI 应用的计算机视觉类型是什么?

    着眼于使计算机能够像人类一样通过“看”来感知世界,从这一视角对人工智能 (AI) 进行了探讨。我将简要比较每一类计算机视觉,尤其关注在本地而不是依赖基于云的资源收集和处理数据,并根据数
    的头像 发表于 12-18 13:09 6833次阅读
    最适合 <b class='flag-5'>AI</b> 应用的<b class='flag-5'>计算机</b>视觉类型是什么?

    NVIDIA Jetson嵌入式系统AI应用

    在这个平台上可以使用多个不同的芯片 ,案例的主角是AIMobile AIM Edge Ncox,一款基于NVIDIA Jetson Orin NX的小型被动冷却嵌入式系统。该系统具有6-8个Arm内核和NVIDIA Ampere
    发表于 12-11 17:37 261次阅读

    Banana Pi为何选择rk3588开发与Jetson Nano引脚兼容的嵌入式产品

    。这篇文章将解释我们选择RK3588的原因以及如何实现与Jetson Nano引脚的兼容性。 Jetson Nano一直是嵌入式计算领域的领先产品,具有强大的性能和丰富的功能,广受开发
    发表于 11-02 12:30

    基于ARM的嵌入式飞行控制计算机系统设计

    电子发烧友网站提供《基于ARM的嵌入式飞行控制计算机系统设计.pdf》资料免费下载
    发表于 10-27 10:35 0次下载
    基于ARM的<b class='flag-5'>嵌入式</b>飞行控制<b class='flag-5'>计算机</b>系统设计

    armsom:为何选择rk3588开发与Jetson Nano引脚兼容的嵌入式产品

    的原因以及如何实现与Jetson Nano引脚的兼容性。Jetson Nano一直是嵌入式计算领域的领先产品,具有强大的性能和丰富的功能,广受开发者和制造商的欢迎。然而,armsom认
    发表于 10-18 17:35

    京东和美团已选用NVIDIA Jetson AGX Xavier 平台

    电商巨头选用NVIDIA Jetson AGX Xavier打造下一代配送机器人 京东、美团采用NVIDIA AI计算平台,以满足大量处理需求
    的头像 发表于 08-01 14:54 545次阅读

    嵌入式计算机主控板芯片bga底部填充胶应用方案

    嵌入式计算机主控板芯片bga底部填充胶应用方案由汉思新材料提供客户是一家专业从事嵌入式计算机控制与测试产品研制、销售及服务的公司。主要业务包括:计算机软硬件的开发及销售,机电产品、电子产品、通信设备
    的头像 发表于 07-10 13:50 437次阅读
    <b class='flag-5'>嵌入式计算机</b>主控板芯片bga底部填充胶应用方案

    Made with KiCad(一):Jetson Nano Baseboard

    ​“ 该项目包含支持NVIDIA Jetson Nano、Xavier NX和TX2 NX SoM的基板,并开源了所有硬件设计文件。它由Antmicro公司创建。Antmicro公司是
    发表于 06-27 13:40

    虹科Gidel的FantoVision边缘计算机可轻松使用NVIDIA Jetson模块

    创新的 虹科Gidel边缘计算机FantoVision 将 高带宽相机接口和图像采集技术与英伟达Jetson系统模块和人工智能 功能 相结合。     2023年5月22日在密歇根州底特律
    的头像 发表于 06-26 14:21 353次阅读

    怎么做才能通过Jetson Xavier AGX构建android图像呢?

    我正在使用 Nvidia 的 Jetson Xavier AGX 按照“android 用户指南”为 imx8 qm Mek 套件构建 android 图像(android 13)。当我运行命令
    发表于 06-07 08:58

    NVIDIA推出DGX GH200 AI超级计算机

    新型AI超级计算机将256个Grace Hopper超级芯片连接为巨大的、1-Exaflop、144TB GPU,用于支持生成式AI、推荐系
    发表于 05-30 14:15 443次阅读
    NVIDIA推出DGX GH200 <b class='flag-5'>AI</b><b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

    新型 AI 超级计算机将 256 个 Grace Hopper 超级芯片连接为巨大的、1-Exaflop、144TB GPU,用于支持生成式 AI
    的头像 发表于 05-30 01:40 1503次阅读
    COMPUTEX2023 | NVIDIA 推出 DGX GH200 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    嵌入式计算机与普通计算机的区别

    嵌入式计算机和普通计算机的主要区别在于它们的设计理念。嵌入式计算机是特定任务的,致力于在几乎没有人机交互的情况下尽可能高效地完成单个任务。它们的专用性利用了轻量级软件和板载ASICS(专用集成电路
    的头像 发表于 05-23 10:11 684次阅读
    <b class='flag-5'>嵌入式计算机</b>与普通<b class='flag-5'>计算机</b>的区别