0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

mW范围内的机器视觉使物联网端点推理变得实用

星星科技指导员 来源:嵌入式计算设计 作者:Semir Haddad 2022-06-06 09:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,尤其是功率效率。

机器视觉已经迅速在世界上找到了自己的位置。可以看到橙子并从树上摘下橙子。 凝视检测针对危险的无意识驾驶员。在工厂车间周围移动的工业机器人依靠它来进行安全的障碍物检测。

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,尤其是功率效率。可以在不超过节点功率容量的情况下进行极端边缘的推理吗?

这个问题值得考虑。这是因为在边缘进行推理可以避免将数据(只有其中一些是可操作的)不加选择地传输到云端进行分析。这降低了存储成本。此外,云访问会损害延迟并抑制实时能力。旅行数据是易受攻击的数据,因此更可取端点处理。这也有利于降低支付给网络运营商的成本。

SoC 架构的新方法

然而,对于所有这些好处,存在一个主要的绊脚石。使用传统微控制器的设备的功耗限制在极端情况下阻碍了神经网络推理。

传统的微控制器 (MCU) 性能无法满足周期密集型操作。方法唤醒解决方案可能依赖机器视觉进行对象分类,而这又需要卷积神经网络 (CNN) 来执行矩阵乘法运算,从而转化为数百万乘法累加 (MAC) 计算(图 1)。

poYBAGKdVo6ATt8OAADnJcvFMII217.png

图 1. 迄今为止,微控制器无法高效处理大容量乘法累加 (MAC) 的问题一直是一个绊脚石。

MCU 存在各种神经网络。但是,这些解决方案未能成为生产就绪型解决方案,因为所需的性能无法超越功率障碍。

克服电源性能困境是为什么采用全新方法处理处理器角色和 SoC 架构的解决方案是有意义的。采用这种新方法需要了解物联网端点需要处理三个工作负载才能成功进行推理。一种是程序性的,一种是用于数字信号处理的,一种是执行大量 MAC 操作的。解决每个工作负载独特需求的一种方法是在 SoC 中结合用于信号处理和机器学习的双 MAC 16 位 DSP 和用于程序负载的 Arm Cortex-M CPU

这种混合多核架构利用了 DSP 双内存库、零循环开销和复杂的地址生成。使用它可以处理任何工作负载组合:例如,网络堆栈、RTOS、数字滤波器、时频转换、RNN、CNN 和传统的人工智能类搜索、决策树和线性回归。图 2 显示了当 DSP 架构优势发挥作用时,神经网络计算性能如何提高 2 倍甚至 3 倍。

poYBAGKdVpSACq-QAAEUFeNx8eY351.png

图 2. 矩阵乘法 (NxN) 基准。

仅仅改变架构是不够的

无论是嵌入式视觉系统还是其他依赖显着提高神经网络效率的系统,实现混合多核架构都很重要。然而,当目标是将功耗降低到 mW 范围时,还需要做更多的工作。认识到这一需求,Eta Compute 获得了连续电压和频率缩放 (CVFS) 专利。

CVFS 克服了动态电压频率缩放或 DVFS 遇到的问题。DVFS 确实利用了降低功率的选项,即降低电压。缺点是执行此选项时最大频率会降低。这个问题将 DVFS 的有效性限制在一个狭窄的范围内——一个由严格限制数量的预定义离散电压电平定义,并限制在几百 mV 的电压范围内。

相比之下,为了在最有效的电压下实现一致的 SoC 操作,CVFS 使用自定时逻辑。有了自定时逻辑,每个设备都可以连续自动调整电压和频率。CVFS 比 DVFS 更有效,也比亚阈值设计更容易实施,CVFS 在另一个重要方面也与这些不同。关键区别在于,上面提到的混合多核架构使 CVFS 已经在做的好事成倍增加。

极端边缘的生产级

处于极端边缘的端点,例如用于人员检测的端点,有特定的需求。尽管任何人都可以将已发布的神经网络用于这些物联网端点,但它们并没有优先满足这些需求。使用领先的设计技术优化这些网络可以解决这个问题。

除了使用先进的设计方法之外,我们在 Eta Compute 采用的神经网络优化方法集中在我们的生产级神经传感器处理器 ECM3532(图 3)上。它融合了混合多核架构和 CVFS 技术的所有优点。

poYBAGKdVpyAANjFAAIQrx-fZpc598.png

图 3. Eta Compute ECM3532 神经传感器处理器的混合多核架构,其中将 Arm Cortex-M3 处理器、NXP CoolFlux DSP、512KB 闪存、352KB SRAM 和支持外设集成在 SoC 中,使推理达到极致在可实现的 mW 范围内的边缘。

获得的知识

诸如图 4 所示结果的测试表明,为了将深度学习引入嵌入式视觉系统,电力成本不必上升到不可接受的水平。虽然没有一根魔杖可以为耗电的神经网络提供支持,但一种将 MCU 电源效率和 DSP 优势与网络优化相结合的方法可以帮助应用程序避免仅依赖云计算导致的安全性、延迟和低效率问题。

pYYBAGKdVrKAcTtFAAJSjVjrOyk700.png

图 4. 在人员检测模型的测试中,包括摄像头在内的平均系统功率达到了 5.6mW。对于该测试,速率为每秒1.3次推理,但进一步细化优化应将平均系统功率进一步降低至 4mW,同时将速率提高到每秒 2 次推理。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2950

    文章

    48151

    浏览量

    418886
  • 摄像头
    +关注

    关注

    61

    文章

    5116

    浏览量

    103539
  • 机器视觉
    +关注

    关注

    166

    文章

    4831

    浏览量

    126550
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    915MHz频段联网天线模块方案选型与应用指南解析

    915MHz频段是工业、科学和医疗(ISM)频段的一部分,在全球范围内广泛应用于联网(IoT)、无线传感器网络(WSN)、LoRa通信、RFID技术、农业
    的头像 发表于 03-02 16:58 874次阅读

    机器视觉镜头如何发现深海沉船

    中使用Theia 的机器视觉镜头。借助3Dfindit,您可以在几秒钟配置并下载 Theia 镜头的 CAD 模型。自定义镜头以满足您的需求,然后下载 100 多种原始和中性格式的模型。 解开一个
    发表于 02-11 16:03

    中国卫星联网:从试验迈向规模商用的关键机遇

    近日,工业和信息化部正式印发《关于组织开展卫星联网业务商用试验的通知》,在全国范围内启动卫星联网商用试验工作,为期两年。
    的头像 发表于 01-20 17:53 1258次阅读

    Lora基站在联网应用的重要性

    Lora基站在联网应用中具有重要的地位。首先,Lora基站可以实现对联网设备的远程监测和控制,为
    发表于 12-03 07:09

    学习联网怎么入门?

    随着联网技术的不断发展,越来越多的人开始关注学习这一领域。但是对于初学者来说,联网似乎是一个庞杂的概念,学习起来很困难。因此,从哪里开始学习
    发表于 10-14 10:34

    学习联网可以做什么工作?

    学习联网专业后,你可以从事多种与联网相关的工作。联网是一个非常新颖和实用的领域,各种应用场
    发表于 10-11 16:40

    机器视觉检测PIN针

    物理损伤)必须进行极其精密的测量与核查。以往依赖人眼的检测方式存在明显短板:不仅作业速度慢、受人员状态影响大(易疲劳导致误判),而且在面对日益严苛的微米级精度标准时显得力不从心。相比之下,基于机器视觉
    发表于 09-26 15:09

    联网设备识别与规避蜂窝移动网络伪基站的技术方案

    基础设施中的应用,伪基站攻击的潜在危害日益凸显。 伪基站工作原理 伪基站是一种非法的无线电通信设备,主要由主机和笔记本电脑组成,能够强制连接用户设备信号,摄取一定半径范围内的设备信息。伪基站的核心威胁在于其能够
    的头像 发表于 09-02 16:55 1646次阅读
    <b class='flag-5'>物</b><b class='flag-5'>联网</b>设备识别与规避蜂窝移动网络伪基站的技术方案

    如何判断电能质量监测装置的数据偏差是否在允许范围内

    LZ-DZ200电能质量在线监测装置 判断电能质量监测装置的数据偏差是否在允许范围内,需结合标准规范、装置精度等级、测量参数类型及实际应用场景(如新能源并网的特殊要求)综合评估,核心是将实测偏差
    的头像 发表于 08-21 09:28 1632次阅读
    如何判断电能质量监测装置的数据偏差是否在允许<b class='flag-5'>范围内</b>?

    请问什么是联网智库?

    什么是联网智库?
    发表于 08-07 06:45

    联网技术促进能量收集创新应用落地

    能量收集并不是一个时兴的名词,但是联网技术的进步以及诸如Silicon Labs的联网产品以及开发套件,使能量收集技术的应用也
    的头像 发表于 07-09 15:07 895次阅读
    <b class='flag-5'>物</b><b class='flag-5'>联网</b>技术促进能量收集创新应用落地

    Aux-Think打破视觉语言导航任务的常规推理范式

    视觉语言导航(VLN)任务的核心挑战,是让机器人在复杂环境中听懂指令、看懂世界,并果断行动。我们系统性地引入推理任务,探索其在导航策略学习中的作用,并首次揭示了VLN中的“推理崩塌”现
    的头像 发表于 07-08 10:00 764次阅读
    Aux-Think打破<b class='flag-5'>视觉</b>语言导航任务的常规<b class='flag-5'>推理</b>范式

    联网蓝牙模块有哪些优势?

    的续航时间。这对于需要长时间运行的联网设备来说,是非常重要的一个优势。传输距离远:相较于其他无线通信技术,蓝牙模块的传输距离较远,可以在100米以内的范围内实现稳定的通信。这使得其在
    发表于 06-28 21:49

    联网的应用范围有哪些?

    的应用范围极其广泛,众多行业都在积极引入这项技术,以提升效率、创新业务模式。 物流行业:在仓储环节,借助联网技术,可实现对货物的实时监测,了解货物的位置、状态等信息,优化仓储空间布局。运输过程中,通过
    发表于 06-16 16:01

    联网未来发展趋势如何?

    近年来,联网行业以其惊人的增长速度和无限的潜力成为了全球科技界的焦点。它正在改变我们的生活方式、商业模式和社会运转方式。那么,联网行业的未来发展趋势将会是怎样的呢?让我们一同探寻其
    发表于 06-09 15:25