0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

恩智浦i.MX 8M Plus帮助实现并行机器学习推理网络

NXP客栈 来源:NXP客栈 作者:NXP客栈 2021-05-18 13:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当下,大多数研究与论文都侧重于针对特定任务的机器学习(ML)模型,分析在执行该模型时达到的精度以及处理架构的效率,但在现场部署实际解决方案时,还有其他诸多需要考虑的因素。恩智浦i.MX 8M Plus应用处理器中集成的,能够提供高达2.3 TOPS加速性能的专用神经网络处理单元(NPU),为用户应用的开发提供更好的选择和灵活性,帮助他们使用机器学习和视觉技术来实现广泛的应用。

Arcturus Networks就开发了一种用于监控银行ATM机网点情况的应用,充分体现了在网络边缘的设备安全相关应用中需要的多功能和技术。恩智浦也非常荣幸邀请到我们的伙伴,Arcturus创新总监David Steele,分享关于该项目及其开发方法的详细信息。

Arcturus团队最近与某家银行合作开展了一个项目,帮助他们监控ATM机网点。该银行希望防止ATM机区域出现拥挤现象,并限制佩戴面罩或头盔者进入。这一应用就是一个很好的边缘人工智能示例,因为网络边缘既是数据源所在的位置,也是需要执行本地操作的位置。同时它也带来了一些非常有趣的挑战。

设计需求与挑战

对采样数据的分析表明,在狭小封闭的ATM空间内,摄像头通常呈俯拍角度,由于它明显呈现自上而下的拍摄角度(图1),会导致检测可信度降低。

另外,该应用还需要区分佩戴和未佩戴面罩的人。这并非只是改进现有类别的检测,使其包括佩戴面罩者那么简单。由于实际操作中头盔或其他面部遮盖物也被视为个人防护装备(PPE),因而需要创建多个新的检测类别(图2)。

此外,该银行还希望扩展分析功能,以便检测可疑行为,包括来回游荡等。

为了提高检测可信度,在网络中增加新检测类别,我们需要使用特定域数据,并进行模型微调或重复的训练。这个过程是从边缘离线完成的,其结果将与正确标记数据集进行对照。此过程迭代进行,但通过使用特定域的数据,其结果可提供非常关键的模型改进。

模型经过训练、微调和验证之后,可将其转移至基于集成专用2.3 TOPS NPU的i.MX 8M Plus应用处理器作主控的设备。另外为了高效利用NPU,模型必须从本地32位浮点(FP32)精度转换为8位整数(INT8)精度。这个量化过程可能会导致一些精度损失,可能需要多次验证。

我们需要通过运行时推理引擎将模型加载到i.MX 8M Plus。恩智浦eIQ机器学习(ML)软件开发环境支持经过移植和验证的Arm NN和TensorFlow Lite推理引擎。不过,边缘运行库版本并不支持所有类型网络需要的所有层——比较新的模型和不太流行的模型通常没有得到广泛支持。

为帮助减少训练和部署边缘人工智能系统所需的时间,Arcturus提供了一个目录,其中包含使用不同精度的预构建模型。这些模型经过预先验证,可支持所有主要边缘运行库;包括支持在CPUGPU、NPU上运行的Arm NN、TensorFlow Lite和TensorRT。他们还提供工具,用于训练或微调模型,以及数据集管理、图像抓取和增强。与运行相同模型的其他公开发布的系统相比,通过将优化运行库、量化模型和NPU硬件组合在一起,可以提供40倍性能提升(图3)。

提高分析精度

一旦模型在边缘高效运行,就需要具备对输出进行分析的能力。如果对静态图像执行分析,二进制分类可以确定是否存在PPE。如果对实时视频执行分析,可能要困难一点,因为局部遮挡和身体姿势将导致检测结果的差异。为了提高精度,我们需要对多个帧进行更智能的判定。为了达到这个目标,我们需要对每个人进行跟踪,以获得更大的样本。运动模型跟踪是一种简单轻量级方法,适合完成此任务,但它依赖于连续检测。如果存在遮挡和障碍物,或者人员离开并重新进入视场,都会导致跟踪丢失。因此,要检测来回游荡的人员,就需要更强大的跟踪方法,能够进行重新识别,而不受时间或空间的影响。

重新识别是通过使用生成视觉外观嵌入的网络来实现的。这个工作流程要求目标识别与分类网络将定位、帧和分类信息传递到嵌入网络(图4)。网络和数据流之间的同步至关重要,因为任何时间偏差都可能导致推理错误。将输出与运动模型数据进行比较,确定身份分配。嵌入可在多个摄像头系统之间共享,它们可用于存档搜索,以创建活动观察列表,甚至通过应用集群技术,进一步进行后期处理。

多目标追踪

要将视觉外观嵌入添加到运动模型跟踪,就需要对每个检测目标进行处理。因此,更多的目标意味着需要更多的处理。在我们的应用中,人数本身受到了物理空间的限制。但是,在视场较大的情况下,这可能带来严重的瓶颈。

为了解决这个问题,Arcturus开发了视觉管道架构,其中不同的处理阶段由节点表示,例如推理、算法、数据或外部服务。每个节点的作用类似于一项微服务,通过紧密同步的序列化数据流来互连。这些节点共同构成了完整的视觉管道,从图像采集一直到本地操作。对于基本应用,各个管道节点可在同一物理硬件上运行。比较复杂的管道的节点可能分布在各个硬件上,例如在CPU、GPU、NPU上,甚至在云端。各个管道在运行时进行协调,使其具有出色的灵活性和可扩展性,有助于确保边缘计算投资能够经受未来考验。每个节点都严谨地模块化,从而可以轻松替换系统的某一部分,例如,即便模型时序发生变化,也可以在不影响系统其余部分的情况下更新推理模型。

这种管道架构是Arcturus Brinq Edge Creator SDK的核心,使我们能够扩展人工智能的性能,进一步讲单一应用处理器的处理能力发挥到极致。例如,在一个基于i.MX 8M Plus设备执行检测的同时,让第二个基于i.MX 8M Plus设备生成嵌入。这些器件可以使用网络结构来轻松进行互连,每个处理器使用两个专用以太网MAC中的一个MAC。如果更进一步,可以将这种软件与Arcturus Atlas硬件平台结合使用,该硬件平台使用包括i.MX 8M Plus的多种硬件配置,可扩展到187fps(图5).

3f29d430-b4d2-11eb-bf61-12bb97331649.png

图5 :Arcturus Atlas硬件平台性能(使用具有加速选项的恩智浦i.MX 8M Plus)

总结一下,进行应用整体设计时,应该考虑到您的需求可能会发生变化。基于类别的检测可能需要利用算法或其他网络来增强。要让您的边缘人工智能经受未来考验,可以基于可扩展管道架构(例如Brinq Edge Creator SDK)进行构建,并且充分利用可扩展的硬件性能,例如采用恩智浦i.MX 8M Plus处理器和NPU加速器的Atlas平台。

原文标题:实现并行机器学习推理网络:i.MX 8M Plus原来可以这么用!

文章出处:【微信公众号:NXP客栈】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网络
    +关注

    关注

    14

    文章

    8131

    浏览量

    93091
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236

原文标题:实现并行机器学习推理网络:i.MX 8M Plus原来可以这么用!

文章出处:【微信号:NXP客栈,微信公众号:NXP客栈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    FRDM i.MX 8M Plus开发板详解

    在开发高级HMI应用、计算机视觉系统以及边缘AI项目时,开发人员常常面临一个共同挑战:如何在不依赖昂贵且复杂的开发平台的前提下,获得足够的处理能力。这正是FRDM i.MX 8M Plus的价值所在,该解决方案是一款专为开发人员
    的头像 发表于 11-18 15:07 677次阅读

    推出i.MX 952人工智能应用处理器

    半导体宣布推出i.MX 9系列的新成员——i.MX 952应用处理器。该处理器专为AI视觉、人机接口(HMI)及座舱感知应用而设计,通过集成eIQ Neutron神经处理单元(N
    的头像 发表于 10-27 09:15 2616次阅读

    i.MX 95处理器如何推动车载HMI演进

    车载人机接口 (HMI) 的持续演进正在重塑驾驶员与车辆之间的交互方式,尤其是在安全性、用户体验与自动化日益融合的背景下。i.MX 95应用处理器提供可扩展、符合安全标准的性能,专为复杂汽车环境设计,有力支持这一转型进程
    的头像 发表于 10-27 09:12 2661次阅读
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>i.MX</b> 95处理器如何推动车载HMI演进

    基于i.MX RT1180芯片的EtherCAT+伺服电机控制方案

    i.MX RT1180是最近推出的一款高性能跨界处理器,其中包含了300MHz的Arm Cortex-M33核以及800MHz的Arm Cortex-
    的头像 发表于 09-22 16:27 8024次阅读
    基于<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>i.MX</b> RT1180芯片的EtherCAT+伺服电机控制方案

    FRDM i.MX 8M Plus开发板上架

    i.MX 8M Plus应用处理器集成2个或4个Arm Cortex-A53核、1个专用于实时控制的Arm Cortex-M7核,以及1个算力高达2.3 TOPS的神经处理单元 (NP
    的头像 发表于 08-16 17:38 1820次阅读
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>FRDM <b class='flag-5'>i.MX</b> <b class='flag-5'>8M</b> <b class='flag-5'>Plus</b>开发板上架

    i.MX 95系列MPU如何赋能边缘计算

    在本系列博文的第一部分,我探讨了i.MX 95系列如何将新功能安全技术应用于工业环境、汽车领域及其他边缘应用。在接下来的文章中,我将进一步阐述i.MX 95系列如何赋能边缘计算,
    的头像 发表于 07-30 11:08 2365次阅读
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>i.MX</b> 95系列MPU如何赋能边缘计算

    如何实现安卓与i.MX RT1170的无线投屏与控制

    Scrcpy是一款免费开源的软件,支持将安卓端屏幕投影到其他设备,并支持被投屏设备对安卓的反向控制。基于ADB工具,安卓端无需安装任何软件,延迟低,稳定性好。现在,安卓也可投屏到i.MX RT1170上。
    的头像 发表于 06-26 09:53 1937次阅读
    如何<b class='flag-5'>实现</b>安卓与<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>i.MX</b> RT1170的无线投屏与控制

    TPS6521825 适用于 NXP i.MX 8M mini 的电源管理 IC数据手册

    TPS6521825 是一款单芯片电源管理 IC (PMIC),专门用于支持 i.MX 8M Mini 处理器和 LP873347 器件。该器件的额定温度范围为 –40°C 至 +105°C,适用于各种工业应用。
    的头像 发表于 05-04 10:44 554次阅读
    TPS6521825 适用于 NXP <b class='flag-5'>i.MX</b> <b class='flag-5'>8M</b> mini 的电源管理 IC数据手册

    分享!基于NXP i.MX 8M Plus平台的OpenAMP核间通信方案

    i.MX 8M Plus平台。 OpenAMP架构 AMP(Asymmetric Multi-Processing),即非对称多处理架构。“非对称AMP”双系统是指多个核心相对独立运行不同的操作系统或
    的头像 发表于 02-27 10:44 873次阅读
    分享!基于NXP <b class='flag-5'>i.MX</b> <b class='flag-5'>8M</b> <b class='flag-5'>Plus</b>平台的OpenAMP核间通信方案

    推出FRDM i.MX 93开发板

    备受嵌入式开发者青睐的FRDM开发平台,迎来了一位新成员——FRDM i.MX 93开发板,这也是第一块配备i.MX MPU的FRDM开发板,意味着强大的FRDM生态合作体系,已
    的头像 发表于 02-21 14:22 2920次阅读

    2.3T算力,真的强!1分钟学会NPU开发,基于NXP i.MX 8MP平台!

    科技飞速发展,人工智能与工业领域的融合日益深入。NXP旗下的i.MX 8M Plus作为一款高端工业处理器,NPU算力高达2.3TOPS,正引领着工业智能化的浪潮,为众多工业场景带来了前所未有的变革
    的头像 发表于 01-24 10:21 978次阅读
    2.3T算力,真的强!1分钟学会NPU开发,基于NXP <b class='flag-5'>i.MX</b> <b class='flag-5'>8</b>MP平台!

    i.MX 94应用处理器如何变革工业和汽车连接

    半导体发布i.MX 94系列应用处理器,为工业和汽车连接设定了新的标准。作为i.MX 9系列应用处理器的最新成员,i.MX 94旨在提
    的头像 发表于 01-17 10:51 1538次阅读

    基于i.MX95的边缘计算人工智能解决方案

    、集成式eIQ Neutron神经处理单元(NPU),可实现机器学习和先进边缘应用,其应用领域涵盖汽车、工业和物联网。 作为
    的头像 发表于 12-26 09:57 2360次阅读
    基于<b class='flag-5'>i.MX</b>95的<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>边缘计算人工智能解决方案

    i.MX 91生态合作伙伴最新开发板资源

    i.MX 91应用处理器系列能够快速实现基于Linux的经济高效的边缘应用程序。i.MX 91处理器在保持实惠价格的同时,融合了高性能
    的头像 发表于 12-20 17:00 2395次阅读

    i.MX RT700系列MCU的优势

    作为边缘智能时代的嵌入式工程师,你对一款理想的MCU有何期待?高性能、高集成、低功耗、更安全,以及出众的AI推理能力……半导体新近发布的i.MX RT700跨界MCU系列,就是你
    的头像 发表于 12-09 09:16 2939次阅读