0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么我们要在嵌入式设备越来越多地使用AI?

广州虹科电子科技有限公司 来源:智能感知解决方案 作者:虹科智能感知团队 2021-07-04 13:09 次阅读

到目前为止,人工智能(包括训练和推理)主要为数据中心开发。随着“边缘AI”这个新兴领域的出现,这个趋势正在发生变化。在不久的将来,智能手机机器人无人机、监控摄像头和工业相机等设备都将配备AI处理功能。如果直接在成像设备上进行推理,事情就会变得有趣得多。离开了大数据中心,这种大功率技术如何在资源优化的嵌入式设备中高效及可持续地使用呢?目前,市场上已经有一些解决方案能够在边缘设备上有效加速神经网络。但在灵活度方面,只有少部分解决方案才能跟上快速发展的AI技术的步伐。

边缘智能

简单来说,通过神经网络机器学习算法,边缘智能设备能够在网络“边缘设备上”完成推理任务。问题是,为什么我们要在嵌入式设备越来越多地使用AI以及为什么整个行业开始关注深度学习和深度神经网络?

对于这个问题,答案与AI本身无关,而与带宽、延时、安全性或者分散式数据处理这些话题相关。这就涉及到了现代工业4.0应用的核心主题和挑战。把大量传感器或者相机数据过滤或者转换成边缘设备上已有的可用信息,以减少共享通信信道的内在带宽竞争,是一项重要的任务。即时数据处理能够在图像捕捉设备上直接做出处理决定,不会出现数据通信延时。从技术或者安全性的角度而言,甚至很难实现与中央处理器(可能在云端)进行可靠、持续的通信。以这种方式在边缘设备上封装获得的数据有助于分散数据储存和处理,减少整个系统受到攻击的可能性。毕竟,生成和传输的数据安全性对于每个组织而言都至关重要。

分布式系统智能对作业相关的任务进行了清晰的区分。比如,一个工厂可能有几百个工位,每个工位都需要图像分类服务,对不同组的目标进行分析。但是,在云端托管多个分类器并非免费。节省成本的解决办法就是训练云端的所有分类器,把模型发送到边缘设备,这些边缘设备已根据各个工位的情况进行过调整。每个模型的性能比在所有工位做出预测的分类器更好。此外,相对于在实现数据中心这一功能,这种简单的方案还缩短研发周期。所有这些都表明应该将推理下放至边缘设备。

挑战

为什么“实际上”神经网络不适合嵌入式使用,“在边缘设备上”使用它们面临哪些挑战?在边缘设备上进行AI推理任务并不容易。总的来说,效率是边缘计算的核心。通常,边缘设备可用的计算、存储和能源资源都是有限的。因此,计算必须高效进行,同时在低延时的情况下提供高性能,这两者好像自相矛盾。我们也通过运行卷积神经网络(CNN)来解决这一矛盾。CNN以高密度计算而著称,处理一个输入时需要进行数十亿次计算。CNN架构本身需要数百万个参数描述,因此原则上并非边缘计算的理想候选方案。所谓的“参数高效”网络(如MobilNet、EfficientNet和SqueezeNet)由少量参数描述,适合嵌入式使用。这极大减少了内存和计算需求。不仅如此。为了进一步减少存储需求,必须压缩网络。例如,经过所谓的“剪枝”训练,可以删除不重要的参数,通过“量化”,也可以减少描述参数的位元数量。CNN内存减少对处理时间产生积极的影响。然后就是最后一个需要优化的层面。

虽然使用了参数高效和压缩网络,但是为了在边缘高效运行AI,必须继续使用一种为这些架构特别订制的计算系统。为此,需要考虑两个基本系统属性。除了已经提到的效率外,该系统还应具备灵活性以支持CNN架构的新技术发展。这一点很重要,尤其是在AI领域,每月都会研发出新的架构和层类型。今天的新技术明天可能就会成为昨日黄花。有哪些平台可供选择呢?

平台选择

基于CPU的系统无疑提供最大灵活性。但与此同时,在运行CNN时,CPU效率非常低,能耗也很高。

GPU通过并行计算核心以较高功率运行CNN。GPU在图像处理方面比CPU专业,而且还拥有较高的灵活性。然而,GPU能耗大,因此在边缘设备上运行会存在很多问题。

编程FPGA架构可以在现场重新配置,因此可以适应新的CNN架构。FPGA支持并行运行模式,因此能够高效运行。然而,FGPA编程要求具备较高程度的硬件知识。

作为定制的集成电路,全套ASIC解决方案在效率方面明显更胜一筹,因为它经过专门优化,能够有效执行给定的CNN架构。但是,如果新的或变更后的CNN架构得不到支持,灵活性就是一个问题。

FPGA技术具有“高性能,灵活和节能”等优势,因此在当前AI开发阶段,最适合用来在边缘设备上实现CNN加速器。

对于特殊的应用场合或CNN,通过新的配置文件更新即可在设备运行期间随时对它进行修改这一特点,使其成为一种可以长期使用的解决方案,因此,它适合工业应用场合。使用FPGA技术的最大挑战就是编程复杂,只能由专业人士完成。

开发策略

为了在“视觉边缘设备”(即:IDS NXT相机)中运行神经网络,我们决定在FPGA技术的基础上开发CNN加速器。我们称它为“深海核心”。但是为了以后尽可能简单地使用FPGA,我们只开发一种通用架构,而不是为了不同的CNN类型开发几种专门优化的配置。如果CNN由受支持的层组成,加速器能够运行任何CNN网络。然而,因为所有的常规层(卷积层、附加层、各种池化层或压缩激励层)已经得到支持,所以几乎所有重要的层类型都能使用。这就完全解决了编程困难的问题,因为用户不需要任何专业知识就能创建新的FPGA配置。通过对IDS NXT相机进行固件更新,深海核心不断进化以支持CNN领域发生的新变化。

深海核心

通用CNN加速器如何运作?要运行一个受训的神经网络,哪些步骤是必要的?加速器只需要一种显示构成CNN网络各层的“二进制描述”。这也不需要编程就能实现。但是,经过Keras训练的神经网络处于一种加速器无法理解的特殊的“Keras高级语言”状态。因此,必须将神经网络转换为类似“链表”的二进制格式。CNN网络的每一层都变成节点端描述符,对各层进行精确地描述。最终结果是CNN(以二进制表示)的完整串联列表。整个转换过程由工具自动化完成。不需要任何专业知识。生成的二进制文件会进入相机的内存并由深海核心进行处理。CNN网络现在就可以在IDS NXT相机上运行。

运行的灵活性

将CNN表示作为链表在加速器灵活性方面具有明显的优势。它可以实现在动态网络之间随时无缝切换,而且还没有延迟。相机的工作内存可以加载数个以“链表”形式存在的不同神经网络。选择要运行的CNN之前,深海加速器必须指向其中一个表的起始位置。唯一要做的是更改其中一个表内存的“指针值”。FPGA寄存器的这种简单写入操作随时都可以快速进行。

以下示例解释了快速切换CNN网络的重要性。比如您的一条产品线同时运行两种类型的产品。而您想要检查产品质量。首先确认产品位置,然后在已确认的产品类别基础上,根据产品特定的缺陷对质量进行分类。

要解决该任务,可以通过对各个产品组的所有潜在失败案例进行预训练,从而训练庞大的CNN网络来找到对象并同时对它们分类。这个方法成本高昂,还会增加网络规模并且可能导致运行缓慢,但是确实可行。它的难点在于如何达到足够的精确度。凭借随时可以改变主用CNN网络这一特性,您可以将不同目标的本地化和分类区分开,结果是单个CNN更容易训练。要识别对象,您只需区分两个分类并提供它们的位置。对于产品相关的属性和缺陷分类,需额外训练两个网络。根据本地化的产品,相机应用程序会自动决定要激活哪个分类网络,以确定相应的产品质量。通过这种方法,边缘设备处理的任务变得相对简单,参数也很少。结果就是,单个网络规模大幅缩小,需要区分的功能也减少很多,导致效率提升,能耗减少,非常适合在边缘设备上执行。

性能强,效率高

IDS NXT推理相机中基于FPGA的CNN加速器通过带64位计算核心的Xilinx Zynq Ultrascale SoC来运行。很多知名图像分类网络(例如MobileNet、SqueezeNet或EfficientNet)可以达到每秒67帧的帧率。对于边缘计算而言,有些网络架构(Inception 或ResNet)被认为过于复杂,但是也能达到每秒20帧,已经能够满足很多应用程序的需要。FPGA能够进一步开发深海加速器的性能。固件更新对所有现场的相机都有利。

然而,对于边缘计算来说,更为重要的是能效。它表示每使用一瓦电,系统每秒可以处理的图像数量。因此能效对于比较不同边缘解决方案而言是一个很好的指标。以下图表比较了不同的CNN加速器。

实现FPGA的深海核心,配备Jetson TX 2A的GPU 解决方案,配备最新Intel Core-i7 CPU的传统CPU解决方案,Raspberry Pi嵌入式CPU解决方案以及以Intel Movidius AI芯片为代表的ASIC解决方案。

一体化推理相机解决方案

为了使基于FPGA的CNN加速器更易于使用,虹科提供了完整的推理相机解决方案,让每个人都可以轻松使用这种技术。无需任何在深度学习,图像处理或相机/FPGA编程方面的任何专业知识,用户即可训练和运行神经网络,并且可以立即启用基于AI的图像处理。简单上手的工具降低了入门门槛,让用户在几分钟内就可以创建推理任务并立即在相机上运行。整个概念不仅涉及智能相机平台虹科 NXT(配备以FPGA技术为基础的CNN加速器“深海核心”),还包括易用的神经网络训练软件。所有组件均由虹科合作伙伴IDS直接开发,可实现完美协作。这不仅简化了工作流程,还提高了整个系统的效率。

可持续的边缘智能

本文列举的所有神经网络加速方案都有各自的优点和缺点。如果终端用户必须处理必要的组件以便将AI用于机器视觉任务,则倾向于他们使用完全集成的AI加速器,例如Intel Movidius。即用型芯片解决方案效率高,能够实现只有大批量采购才能获得的单价,并且由于存在大量的功能文档记录,因此可以快速、相对轻松地集成到系统中。但是,有一个问题。AI环境如今发展势头强劲,日新月异,而即用型芯片解决方案开发周期过长。为了开发在今天能够普遍使用并且高度灵活的“边缘智能”,系统组件必须满足其他要求。FPGA集灵活性、性能、能效和可持续性于一身。毕竟,衡量工业产品的一个最重要的标准就是“工业适用性”,而确保“工业适用性”的因素包括长期可用性和简单以及长期的可维护性。如今,易用的虹科NXT推理相机平台与FPGA CNN加速器相结合,提供了一种可持续的边缘智能端到端解决方案,使终端用户无需担心单个组件和AI更新。

责任编辑:lq6

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    4981

    文章

    18274

    浏览量

    288362
  • AI
    AI
    +关注

    关注

    87

    文章

    26424

    浏览量

    264030

原文标题:虹科智能感知 | 未来AI的推理加速器

文章出处:【微信号:Hongketeam,微信公众号:广州虹科电子科技有限公司】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    随着非车规器件在汽车上泛滥FPGA会不会越来越多的出现在汽车上?

    随着非车规器件在汽车上泛滥FPGA会不会越来越多的出现在汽车上?
    发表于 04-23 14:50

    嵌入式热门发展方向有哪些?

    嵌入式热门发展方向有哪些? 现在越来越多的计算机、电子、通信、自动化等相关专业跨行学习嵌入式嵌入式开发作为未来职业发展的方向,不论从薪资待遇还是发展前景来看,都非常不错。 在
    发表于 04-11 14:17

    嵌入式越来越卷吗?

    嵌入式系统能够实现更快速、更稳定的通信。 这使得嵌入式系统能够更好地与其他设备或系统进行交互和协作。 安全性增强:随着网络安全问题的日益严重,嵌入式系统的安全性也受到了
    发表于 03-18 16:41

    嵌入式系统发展前景?

    应用领域。随着汽车电子化和智能化程度的不断提高,嵌入式系统将在汽车控制、安全系统、自动驾驶等方面发挥更为重要的作用。 工智能和机器学习技术的发展为嵌入式系统提供了新的发展机遇。嵌入式AI
    发表于 02-22 14:09

    嵌入式开发学习的十三法则分享

    实训QQ754634522 九、简约性法则 当简约一个嵌入式系统时,系统剩下的功能之 间的互动关系就会变得越来越强; 当系统的功能被简约之后,外来的入侵者之成 功的概率就会变得越来越
    发表于 12-21 06:32

    单片机在以后会越来越趋向于低端化应用吗?

    随着现在的技术和产品功能需求越来越高,好像单片机能完成的事情越来越少;以后是不是嵌入式芯片是主流,单片机渐渐只能在低端上应用?
    发表于 10-24 08:30

    什么是嵌入式Linux?

    发展需要不断进化。随着芯片性能的增强和社会变革的需要,嵌入式系统越来越承接更多、更复杂的功能,所以嵌入式开发也以高薪稳定的状态稳坐在就业的顶端。(相较于其他行业,嵌入式工程师的工资在同
    发表于 10-11 13:47

    从事嵌入式工作有哪些优势?

    随着物联网和人工智能的发展,嵌入式技术越来越值钱,学嵌入式的人也越来越多,现在开始入行嵌入式。根据一些权威部门统计,我国目前
    发表于 10-08 15:05

    RTOS引领嵌入式产业发展

    RTOS产生的背景、RTOS的发展历程、国内RTOS/IoT OS市场格局概况、越来越多智能设备以RTOS为核心、“轻”智能时代渐行渐近、AIoT 时代,RTOS的发展趋势等
    发表于 09-05 07:28

    请问rt-thread中有用flashdb保存参数的吗?为什么kv越多越慢呢?

    flashdb来保存参数和日志。 但是实际使用中发现flashdb随着参数写入的增多,写入速度越来越慢,读取速度也越来越慢。 不知道大家遇到过没有,如何解决这个问题呢?或者有其他嵌入式好用的KV数据推荐吗?
    发表于 09-03 10:40

    为什么越来越多的大厂选择柔性制造?

    的自适应和自动化,提高生产效率和产品质量。在当今增量市场往存量市场发展的大背景下,受到了越来越多企业尤其是行业头部企业的青睐。
    的头像 发表于 08-02 16:19 469次阅读
    为什么<b class='flag-5'>越来越多</b>的大厂选择柔性制造?

    为什么越来越多的开发选择单芯片解决方案呢?单芯片的优势你了解吗?

    芯片嵌入式物联网STM32
    学习电子知识
    发布于 :2023年08月02日 12:39:50

    相较投影、拼接屏,为什么越来越多人选择LED一体机开会?

    ,带动了会议类相关产品的增长。其中,投影、拼接屏、LED一体机三大品类受到市场关注,LED一体机更是成为越来越多企业的选择。 那么,LED一体机、投影、拼接屏这三者到底有何区别?为什么当下越来越多企业使用LED一体机?采购人员
    的头像 发表于 07-03 15:59 396次阅读
    相较投影、拼接屏,为什么<b class='flag-5'>越来越多</b>人选择LED一体机开会?

    为什么越来越多的用户选择液晶拼接屏

    液晶拼接屏是商业大屏显示中的主力产品,其清晰度高而且可以自由拼接大小,显示功能也是十分丰富,经常被应用于会议室、监控室、展厅等等!那么,为什么越来越多的用户选择液晶拼接屏?我们不妨看看景信科技小编为大家做的介绍。
    的头像 发表于 05-29 09:18 282次阅读
    为什么<b class='flag-5'>越来越多</b>的用户选择液晶拼接屏

    为什么越来越多的用户选择液晶拼接屏

    液晶拼接屏是商业大屏显示中的主力产品,其清晰度高而且可以自由拼接大小,显示功能也是十分丰富,经常被应用于会议室、监控室、展厅等等!那么,为什么越来越多的用户选择液晶拼接屏?我们不妨看看景信科技小编为大家做的介绍。
    的头像 发表于 05-26 15:24 338次阅读