0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Isaac Initiative应用在领域训练和部署高级AI中

星星科技指导员 来源:NVIDIA 作者:Dustin 2022-04-18 10:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 发布了JetPack 3.1,这是用于 Jetson TX1 和 TX2 的生产 Linux 软件版本。随着对 TensorRT 2.1 和 cuDNN 6.0 的升级,JetPack 3.1 为视觉引导导航和运动控制等实时应用提供了高达 2 倍的深度学习推理性能提升,这些应用受益于加速的批量大小 1。改进的功能使 Jetson 能够部署比以往任何时候都更强大的智能,实现一代自主机器,包括送货机器人、远程呈现和视频分析。为了进一步推动机器人技术的发展,NVIDIA 最近推出的 Isaac Initiative 是一个端到端平台,用于在该领域训练和部署高级 AI

边缘的人工智能

今年春天早些时候,当 NVIDIA 推出Jetson TX2时,事实上的边缘计算平台在功能上得到了显着提升。如图 1 中的 Wave Glider 平台所示,位于网络边缘的远程物联网IoT) 设备经常会遇到网络覆盖、延迟和带宽下降的情况。虽然物联网设备通常用作将数据中继到云的网关,但边缘计算通过访问安全的板载计算资源重新构建了物联网的可能性。NVIDIA 的 Jetson 嵌入式模块在 Jetson TX1 上以 1 TFLOP/s 的速度提供服务器级性能,并在 10W 的功率下将 Jetson TX2 上的 AI 性能提高一倍。

喷气背包 3.1

JetPack 3.1 with Linux For Tegra (L4T) R28.1 是 Jetson TX1 和 TX2 的生产软件版本,具有长期支持 (LTS)。TX1 和 TX2 的 L4T 板级支持包 (BSP) 适用于客户产品化,其共享的 Linux 内核 4.4 代码库提供了两者之间的兼容性和无缝移植。从 JetPack 3.1 开始,开发人员可以在 TX1 和 TX2 上访问相同的库、API 和工具版本。

除了从 cuDNN 5.1 升级到 6.0 以及对 CUDA 8 的维护更新之外,JetPack 3.1 还包括用于构建流应用程序的最新视觉和多媒体 API。您可以将 JetPack 3.1 下载到您的主机 PC,以使用最新的 BSP 和工具刷新 Jetson。

使用 TensorRT 2.1 进行低延迟推理

JetPack 3.1 中包含最新版本的 TensorRT,因此您可以在 Jetson 上部署优化的运行时深度学习推理。TensorRT 通过网络图优化、内核融合和半精度 FP16 支持提高了推理性能。TensorRT 2.1 包括关键功能和增强功能,例如多权重批处理,可进一步提高 Jetson TX1 和 TX2 的深度学习性能和效率并减少延迟。

批量大小 1 的性能已显着提高,从而将 GoogLeNet 的延迟降低到 5 毫秒。对于延迟敏感的应用程序,批量大小 1 提供最低延迟,因为每个帧一到达系统就会被处理(而不是等待批量处理多个帧)。如图 2 所示,在 Jetson TX2 上,使用 TensorRT 2.1 在 GoogLeNet 和 ResNet 图像识别推理方面的吞吐量是 TensorRT 1.0 的两倍。

图 2:使用 Jetson TX2 Max-Q 和 Max-P 功率曲线的 GoogLeNet 和 ResNet-50 的推理吞吐量。TensorRT 2.1 在 GoogleLeNet 和 ResNet 上提供两倍的推理吞吐量。

表 2 中的延迟显示随着批量大小 1 的成比例减少。使用 TensorRT 2,Jetson TX2 在 Max-P 性能配置文件中实现了 5ms 的 GoogLeNet 延迟,在 Max-Q 效率配置文件中实现了 7ms 的延迟。ResNet-50 在 Max-P 中具有 12.2ms 的延迟,在 Max-Q 中具有 15.6ms 的延迟。ResNet 通常用于提高图像分类的准确性,超越 GoogLeNet,使用 TensorRT 2.1 可将运行时性能提高 2 倍以上。借助 Jetson TX2 的 8GB 内存容量,即使在 ResNet 等复杂网络上也可以实现高达 128 的大批量。

减少的延迟允许深度学习推理方法用于需要近实时响应的应用程序,例如高速无人机和水面车辆的防撞和自主导航。

自定义图层

通过用户插件 API 支持自定义网络层,TensorRT 2.1 能够运行最新的网络和扩展支持的功能,包括残差网络 (ResNet)、循环神经网络 (RNN)、你只看一次 (YOLO) 和更快-RCNN(区域卷积神经网络)。自定义层在用户定义的 C++ 插件中实现,这些插件实现IPlugin了如下代码中的接口

#include "NvInfer.h" 

使用 
   


    
      
                            
      
                    ,  
                  
   
   
    
      
                 
               
   
   *缓冲区); 

IPlugin您可以使用与上述代码类似的自定义来构建自己的共享对象。在用户enqueue()函数内部,您可以使用 CUDA 内核实现自定义处理。TensorRT 2.1 使用这种技术来实现Faster-RCNN插件以增强对象检测。此外,TensorRT 为长短期记忆 (LSTM)单元和门控循环单元 (GRU)提供了新的 RNN 层,以改进基于记忆的时序序列识别。开箱即用地提供这些强大的新层类型可加速您在嵌入式边缘应用程序中部署高级深度学习应用程序。

NVIDIA 艾萨克计划

随着边缘 AI 功能的快速增长,NVIDIA 推出了 Isaac Initiative 以推进机器人技术和 AI 的最新发展。Isaac是一个端到端机器人平台,用于开发和部署智能系统到现场,包括模拟、自主导航堆栈和用于部署的嵌入式 Jetson。为了开始开发自主 AI,Isaac 支持图 3 所示的机器人参考平台。这些由 Jetson 提供动力的平台包括无人机、无人地面车辆 (UGV)、无人水面车辆 (USV) 和人类支持机器人 (HSR)。参考平台提供了一个由 Jetson 驱动的基础,可以在现场进行实验,并且该计划将随着时间的推移而扩展,以包括新的平台和机器人。

开始部署 AI

JetPack 3.1 包括 cuDNN 6 和 TensorRT 2.1。它现在可用于 Jetson TX1 和 TX2。凭借将单批次推理的低延迟性能提高一倍,并支持具有自定义层的新网络,Jetson 平台比以往任何时候都更有能力进行边缘计算。

关于作者

Dustin 是 NVIDIA Jetson 团队的一名开发人员推广员。Dustin 拥有机器人技术和嵌入式系统方面的背景,喜欢在社区中提供帮助并与 Jetson 合作开展项目。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    214

    文章

    31634

    浏览量

    224489
  • NVIDIA
    +关注

    关注

    14

    文章

    5725

    浏览量

    110287
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型训练部署实战 | 线下免费培训

    你是否想系统了解AI落地全链路,但缺少一个完整的实战项目练手?模型部署环节繁多,缺乏一套清晰的实战路径?4月18日、4月25日、5月16日RT-Thread将分别在苏州、成都、南京举办“AI模型
    的头像 发表于 04-07 13:08 774次阅读
    <b class='flag-5'>AI</b>模型<b class='flag-5'>训练</b>与<b class='flag-5'>部署</b>实战 | 线下免费培训

    NVIDIA 携手全球机器人领导者,将物理 AI 带入现实世界

    基于 NVIDIA 技术,大规模开发并部署物理 AINVIDIA 发布全新 NVIDIA Cosmos 世界模型、
    的头像 发表于 03-17 11:22 788次阅读
    <b class='flag-5'>NVIDIA</b> 携手全球机器人领导者,将物理 <b class='flag-5'>AI</b> 带入现实世界

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron、
    的头像 发表于 03-16 16:27 785次阅读
    <b class='flag-5'>NVIDIA</b> Jetson模型赋能<b class='flag-5'>AI</b>在边缘端落地

    请问CW32低功耗32位微控制器可以应用在哪些领域了?

    CW32低功耗32位微控制器可以应用在哪些领域了?
    发表于 01-14 06:30

    CW32F系列MCU主要应用在哪些领域了?

    CW32F系列MCU主要应用在哪些领域了?有具体的应用案例吗?
    发表于 01-12 08:06

    NVIDIA Omniverse基于Container的部署推流方案

    为了让客户能够高效安装和部署 NVIDIA Omniverse 及 NVIDIA Isaac 平台,NVIDIA 现已推出简单便捷的容器化
    的头像 发表于 12-17 10:17 1075次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse基于Container的<b class='flag-5'>部署</b>推流方案

    仅使用智能手机在NVIDIA Isaac Sim重建场景

    4)探索该场景,可前往 NVIDIA Physical AI 上的 Hugging Face 获取相关资源。
    的头像 发表于 11-10 14:03 1258次阅读

    NVIDIA Isaac Lab推动机器人技术突破

    Isaac Lab 是 Isaac Gym 的替代版本,该框架已将 GPU 原生机器人仿真扩展至大规模多模态学习的全新领域Isaac Lab 整合了 GPU 并行的物理真实的仿真、逼
    的头像 发表于 10-21 11:20 1430次阅读

    NVIDIA Isaac Lab多GPU多节点训练指南

    NVIDIA Isaac Lab 是一个适用于机器人学习的开源统一框架,基于 NVIDIA Isaac Sim 开发,其模块化高保真仿真适用于各种
    的头像 发表于 09-23 17:15 2763次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Isaac</b> Lab多GPU多节点<b class='flag-5'>训练</b>指南

    利用NVIDIA Cosmos模型训练通用机器人

    机器人领域的一大核心挑战在于如何让机器人掌握新任务,而无需针对每个新任务和环境耗费大量精力收集和标注数据集。NVIDIA 的最新研究方案通过生成式 AI、世界基础模型(如 NVIDIA
    的头像 发表于 08-05 16:22 2341次阅读
    利用<b class='flag-5'>NVIDIA</b> Cosmos模型<b class='flag-5'>训练</b>通用机器人

    NVIDIA Jetson + Isaac SDK 在人形机器人领域的方案详解

    NVIDIA Jetson + Isaac SDK 在人形机器人领域的 方案详解 ,涵盖芯片型号、软件平台、开发工具链、应用场景与典型客户等。 一、方案概述:Jetson + Isaac
    的头像 发表于 07-30 16:05 4121次阅读

    ai_cube训练模型最后部署失败是什么原因?

    ai_cube训练模型最后部署失败是什么原因?文件保存路径里也没有中文 查看AICube/AI_Cube.log,看看报什么错?
    发表于 07-30 08:15

    NVIDIA Isaac Lab可用环境与强化学习脚本使用指南

    NVIDIA Isaac Sim 是一款基于 NVIDIA Omniverse 构建的参考应用,使开发者能够在基于物理的虚拟环境模拟和测试 AI
    的头像 发表于 07-14 15:29 2794次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Isaac</b> Lab可用环境与强化学习脚本使用指南

    NVIDIA Isaac Sim和Isaac Lab现已推出早期开发者预览版

    NVIDIA 发布了机器人仿真参考应用 Isaac Sim 和机器人学习框架 Isaac Lab 的开发者预览版。开发者现在可以通过 GitHub 访问早期版本,抢先体验先进功能,用于在基于物理的仿真环境
    的头像 发表于 07-04 14:23 2165次阅读

    NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isa
    的头像 发表于 05-28 10:06 2523次阅读