0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Jetson Xavier NX世上最小嵌入式AI超级计算机

星星科技指导员 来源:NVIDIA 作者:Dustin Franklin 2022-04-18 14:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 发布了世界上最小、最先进的用于自主机器人和边缘计算设备的嵌入式 AI超级计算机 Jetson Xavier NX 。 Jetson Xavier NX 能够在紧凑的 70x45mm 外形中部署服务器级性能,在 15W 的功率下可提供多达 21 台计算机, MLPerf Inference 0.5 是基于 NVIDIA’s Xavier 引脚的 Jetson Nano 的最新计算结果,部署工作负载可能会受到限制,比如基于成本和性能的限制。

图 2 : Jetson Xavier NX 处理器引擎的框图,包括高速 I / O 和内存结构。

如图 2 所示, Jetson Xavier NX 包括集成的 384 核 NVIDIA Volta GPU , 48 个张量核, 6 核 NVIDIA Carmel ARMv8 。 2 64 位 CPU , 8GB 128 位 LPDDR4x ,双 NVIDIA 深度学习加速器( NVDLA )引擎, 4K 视频编码器和解码器,专用摄像机摄取,最多 6 个同时高分辨率传感器流, PCIe Gen 3 扩展、双显示端口/ HDMI 4K 显示器、 USB 3 。 1 和 GPIO ,包括 SPI 、 I2C 、 I2S 、 CAN 总线和 UART 。有关特性列表,请参阅下表 1 ,有关完整规格,请参阅 Jetson Xavier NX 模块数据表 。共享内存结构允许处理器自由地共享内存,而不会产生额外的内存拷贝(称为零拷贝),这有效地提高了系统的带宽利用率和吞吐量。

表 1 : Jetson Xavier NX 计算模块特性和功能

* CPU 4 / 6 核模式下的最大工作频率为 1400MHz ,双核模式下的最大工作频率为 1900MHz

†最大并发流数,达到总吞吐量。支持的视频编解码器: H 。 265 、 H 。 264 、 VP9

有关具体的编解码器和配置文件规范,请参阅 Jetson Xavier NX 模块数据表 。

†††每通道 2 英镑/ MIP ,总计 2 英镑。

‡ PCIe 1 × 1 仅支持根端口, 1 × 1 / 2 / 4 支持根端口或端点模式

^工作温度范围, Xavier SoC 结温( Tj )

Jetson Xavier NX 由 NVIDIA 完整的 CUDA -X 软件栈和 JetPack SDK 开发包 为 AI 开发提供支持,除了实时计算机视觉外,还可以在多个高分辨率传感器流上同时运行流行的机器学习框架和复杂的 DNN ,在全桌面 Linux 环境中加速图形和丰富的多媒体应用程序。 Jetson 与 NVIDIA 的 AI 加速计算平台的兼容性使得开发更加容易,云和 edge 之间的 MIG 无缝匹配。

设计抵押品 Jetson Xavier NX 设计指南 NX 模块将于 2020 年 3 月面市,售价 399 美元,嵌入式设计师可以参考可供下载的 Jetson ,包括 Xavier ,为 Jetson Xavier NX 模块创建生产设备和系统。与 Jetson Nano 的引脚兼容性允许共享设计和直接的技术插入升级到 Jetson Xavier NX 。除了提供现成的载体、传感器和配件外, Jetson 生态系统 的硬件设计合作伙伴还能够提供定制设计服务和系统集成。

软件开发人员现在可以开始为 Jetson Xavier NX 构建人工智能应用程序,方法是使用 Jetson AGX Xavier 开发工具包,并将 设备配置修补程序 应用到 JetPack 上,使设备的行为类似于 Jetson Xavier NX 。通过软件,它将改变可用的 CPU 和 GPU 核心的数量,此外还可以设置整个系统的核心时钟频率和电压。该补丁是完全可逆的,可用于在硬件可用之前近似于 Jetson Xavier NX 的性能。

Jetson Xavier NX 定义了 10 和 15W 的默认电源模式,根据活动模式,可实现 14 到 21 个峰值性能。用于管理电源配置文件的 nvpmodel 工具可调整 CPU 、 GPU 、内存控制器和其他 SoC 时钟的最大时钟频率,以及在线 CPU 集群的数量 – 这些设置如表 2 所示,适用于 Jetson Xavier NX 的预定义 10W 和 15W 模式。 CPU 分为三组,每组 2 个核, 4 / 6 核模式下的最大工作频率为 1400MHz ,双核模式下的最高工作频率为 1900MHz ,对于可能需要更高单线程性能和多线程性能的应用而言,最高工作频率为 1900MHz 。

NVIDIA Jetson Xavier NX – Power Modes

表 2 : Jetson Xavier NX 10W 和 15W 电源模式的最大工作频率和核心配置。

*使用 NVDLA 时, GPU 最大工作频率为 600MHz ( 10W 模式)和 1000MHz ( 15W 模式)

根据工作负载,动态电压和频率缩放( DVFS )调控器在运行时将频率调整到活动 nvpmodel 所定义的最大限制,因此在空闲时根据处理器利用率降低功耗。 nvpmodel 工具还可以根据应用需求和 TDP 轻松创建和定制新的电源模式。可以编辑电源配置文件并将其添加到/ etc / NVP 模式。 conf 配置文件和一个 GUI 小部件被添加到 Ubuntu 状态栏中,以便在运行时方便地管理和切换电源模式。

深度学习推断基准

今天 NVIDIA 还宣布,它在 MLPerf 推断 0 。 5 基准测试中占据了 5 个类别中的 4 个类别的榜首,其中 Jetson AGX Xavier 是边缘计算 SoC 的领导者,包括所有基于视觉的任务:使用 Mobilenet 和 ResNet-50 进行图像分类,以及使用 SSD Mobilenet 和 SSD ResNet 进行目标检测。 NVIDIA GPUs 是十个竞争芯片架构中唯一一个在 MLPerf 定义的所有五个推断测试中提交结果的。

为了参考 Jetson 家族成员之间的可伸缩性,我们还测量了 Jetson Nano 、 Jetson TX2 、 Jetson Xavier NX 和 Jetson AGX Xavier 对图像分类、目标检测、位姿估计、分割等常用 DNN 模型的推理性能。这些结果,如下面的图 3 所示,是用 JetPack 和 NVIDIA 的 TensorRT 推断加速器库运行的,该库优化了网络的实时性能,该库是在流行的 ML 框架(如 TensorFlow 、 PyTorch 、 Caffe 、 MXNet 等)中训练出来的。

图 3 。用 TensorRT 来推断 Jetson 家族中各种基于视觉的 DNN 模型的性能。

Jetson Xavier NX 的性能比 Jetson TX2 高 10 倍,功耗相同,占地面积小 25% 。在这些基准测试期间,每个平台都以最高性能运行( MAX-N 模式用于 Jetson AGX Xavier , Xavier NX 和 TX2 为 15W , Nano 为 10W )。最大吞吐量是在批处理大小不超过 16ms 的延迟阈值的情况下获得的,否则,对于平台超过该延迟阈值的网络,批处理大小为 1 。这种方法在实时应用程序的确定性低延迟需求和多流用例场景的最大性能之间提供了平衡。

在 Xavier Jetson NX 和 Jetson AGX Xavier 上, NVDLA 引擎和 GPU 同时以 INT8 精度运行,而在 Jetson Nano 和 Jetson TX2 上 GPU 以 FP16 精度运行, Jetson Xavier NX 中具有张量核心的 Volta 架构 GPU 可以达到 12 。 3 个计算顶层,而该模块的 DLA 引擎每台最多可产生 4 。 5 台。

除了用 TensorRT 运行神经网络外, ML 框架还可以通过 cuDNN 和 CUDA 加速在 Jetson 上安装,包括 TensorFlow 、 PyTorch 、 Caffe / Caffe2 、 MXNet 、 Keras 等。除了 AWS Greengrass 等物联网框架和 Docker 和 Kubernetes 等容器引擎外, Jetson 动物园 还包括这些预构建的安装程序和构建说明。

开发突破性的人工智能产品

Jetson Xavier NX 为部署下一代自主系统和智能边缘设备开辟了新的机遇,这些设备需要在较小、低功耗的空间内实现高性能人工智能和复杂的 DNN ,比如移动机器人无人机、智能相机、便携式医疗设备、嵌入式物联网系统等等。 NVIDIA 支持 CUDA -X 的 JetPack SDK 提供了开发尖端 AI 解决方案的完整工具,并以世界领先的性能在云端和边缘之间扩展应。

关于作者

Dustin Franklin 是 NVIDIA 的 Jetson 团队的开发人员布道者。 Dustin 拥有机器人和嵌入式系统方面的背景,他乐于在社区中提供帮助,并与 Jetson 一起参与项目。你可以在 NVIDIA Developer Forums 或 Github 上找到他。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5212

    文章

    20763

    浏览量

    338740
  • 机器人
    +关注

    关注

    214

    文章

    31633

    浏览量

    224476
  • NVIDIA
    +关注

    关注

    14

    文章

    5725

    浏览量

    110284
  • 嵌入式AI
    +关注

    关注

    0

    文章

    43

    浏览量

    1533
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    虹科 owa5X 无线嵌入式计算机 工业级边缘计算终端与车载网关优选

    从工业级边缘计算终端到车载高性能边缘计算网关,从工业级嵌入式计算机到边缘智能解决方案,虹科 owa5X 无线嵌入式计算机以高性能、高可靠、高适配的核心特性,满足了工业 4.0 与车载智
    的头像 发表于 02-10 17:08 326次阅读
    虹科 owa5X 无线<b class='flag-5'>嵌入式计算机</b> 工业级边缘<b class='flag-5'>计算</b>终端与车载网关优选

    Microchip发布专为NVIDIA DGX Spark而设计的MEC1723嵌入式控制器定制固件

    DGX Spark个人AI超级计算机定制设计的 MEC1723嵌入式控制器(EC)固件 ,进一步优化MEC1723 EC在NVIDIA D
    的头像 发表于 01-15 18:51 6.6w次阅读
    Microchip发布专为<b class='flag-5'>NVIDIA</b> DGX Spark而设计的MEC1723<b class='flag-5'>嵌入式</b>控制器定制固件

    如何在NVIDIA Jetson平台上运行最新的开源AI模型

    在小型、低功耗的边缘设备上运行先进的 AI计算机视觉工作流正变得越来越具有挑战性。机器人、智能摄像头和自主设备需要实时智能来感知、理解并做出反应,而无需依赖云端。NVIDIA Jetson
    的头像 发表于 12-24 10:38 2041次阅读
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b>平台上运行最新的开源<b class='flag-5'>AI</b>模型

    Amphenol Rugged SOM:超紧凑型嵌入式计算机模块的卓越之选

    Amphenol Rugged SOM:超紧凑型嵌入式计算机模块的卓越之选 在嵌入式计算机模块领域,Amphenol Rugged SOM 以其独特的设计和强大的功能脱颖而出。今天,我们就来详细
    的头像 发表于 12-10 14:15 569次阅读

    嵌入式计算机AF208:自动化装配管理集成方案核心

    在高度自动化的现代汽车装配线上,控制中心的嵌入式计算机扮演着“神经中枢”的角色。当前,汽车制造企业自动化装配管理面临以下痛点:生产设备(机械臂、传送带、焊接机器人)之间难以协同、生产状态不透明导致
    的头像 发表于 10-16 10:15 588次阅读
    <b class='flag-5'>嵌入式计算机</b>AF208:自动化装配管理集成方案核心

    3C智造的核心:杰和嵌入式计算机AE613筑牢可靠基石

    嵌入式计算机提供核心支撑。杰和科技基于英特尔13代Core i3/i5处理器打造的嵌入式计算机AE613,正是为应对这些挑战而设计的智能产线基座。
    的头像 发表于 09-29 16:46 2733次阅读
    3C智造的核心:杰和<b class='flag-5'>嵌入式计算机</b>AE613筑牢可靠基石

    军用导航领域嵌入式计算机分析

    在导航系统中,嵌入式计算机的核心作用是实时处理多种传感器的数据,运行复杂的导航算法,最终计算出载体的精确位置、姿态、速度和时间信息。
    的头像 发表于 09-26 16:52 1361次阅读

    NVIDIA DGX Spark桌面AI计算机开启预订

    DGX Spark 现已开启预订!丽台科技作为 NVIDIA 授权分销商,提供从产品到服务的一站解决方案,助力轻松部署桌面 AI 计算机
    的头像 发表于 09-23 17:20 1644次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark桌面<b class='flag-5'>AI</b><b class='flag-5'>计算机</b>开启预订

    基于 NVIDIA Blackwell 的 Jetson Thor 现已发售,加速通用机器人时代的到来

    ·专为物理 AI 和机器人打造的机器人计算机 NVIDIA Jetson AGX Thor 开发者套件和量产级模组,现已发售。 ·超过 200 万开发者正在使用
    发表于 08-26 09:28 1396次阅读
    基于 <b class='flag-5'>NVIDIA</b> Blackwell 的 <b class='flag-5'>Jetson</b> Thor 现已发售,加速通用机器人时代的到来

    NVIDIA Jetson + Isaac SDK 人形机器人方案全面解析

    NVIDIA Jetson + Isaac SDK 人形机器人方案全面解析 一、方案概述 Jetson 硬件平台 :提供 AI + GPU 运算能力,配合多传感器、视觉、传动控制体系
    的头像 发表于 07-30 16:12 2587次阅读

    Jetson平台核心组件BOM清单概览

    Jetson平台核心组件BOM清单概览 NVIDIA Jetson系列作为业界领先的边缘计算和人工智能(AI)平台,其强大的性能背后是一系列
    的头像 发表于 07-30 16:11 3663次阅读

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其
    的头像 发表于 07-28 15:07 1534次阅读

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算经历了多次迭代,每一次都源于对技术的创造性再利用。例如,早期的
    的头像 发表于 06-26 19:39 1494次阅读
    <b class='flag-5'>NVIDIA</b>驱动的现代<b class='flag-5'>超级</b><b class='flag-5'>计算机</b>如何突破速度极限并推动科学发展

    Blue Lion超级计算机将在NVIDIA Vera Rubin上运行

    德国莱布尼茨超算中心(LRZ)将迎来全新超级计算机 Blue Lion,其算力比该中心现有的 SuperMUC-NG 高性能计算机提升了约 30 倍。这台新的超级
    的头像 发表于 06-12 15:39 1449次阅读

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级
    的头像 发表于 06-12 15:33 1766次阅读