0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

mW范围内的机器视觉使物联网端点推理变得实用

星星科技指导员 来源:嵌入式计算设计 作者:Semir Haddad 2022-06-06 09:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,尤其是功率效率。

机器视觉已经迅速在世界上找到了自己的位置。可以看到橙子并从树上摘下橙子。 凝视检测针对危险的无意识驾驶员。在工厂车间周围移动的工业机器人依靠它来进行安全的障碍物检测。

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,尤其是功率效率。可以在不超过节点功率容量的情况下进行极端边缘的推理吗?

这个问题值得考虑。这是因为在边缘进行推理可以避免将数据(只有其中一些是可操作的)不加选择地传输到云端进行分析。这降低了存储成本。此外,云访问会损害延迟并抑制实时能力。旅行数据是易受攻击的数据,因此更可取端点处理。这也有利于降低支付给网络运营商的成本。

SoC 架构的新方法

然而,对于所有这些好处,存在一个主要的绊脚石。使用传统微控制器的设备的功耗限制在极端情况下阻碍了神经网络推理。

传统的微控制器 (MCU) 性能无法满足周期密集型操作。方法唤醒解决方案可能依赖机器视觉进行对象分类,而这又需要卷积神经网络 (CNN) 来执行矩阵乘法运算,从而转化为数百万乘法累加 (MAC) 计算(图 1)。

poYBAGKdVo6ATt8OAADnJcvFMII217.png

图 1. 迄今为止,微控制器无法高效处理大容量乘法累加 (MAC) 的问题一直是一个绊脚石。

MCU 存在各种神经网络。但是,这些解决方案未能成为生产就绪型解决方案,因为所需的性能无法超越功率障碍。

克服电源性能困境是为什么采用全新方法处理处理器角色和 SoC 架构的解决方案是有意义的。采用这种新方法需要了解物联网端点需要处理三个工作负载才能成功进行推理。一种是程序性的,一种是用于数字信号处理的,一种是执行大量 MAC 操作的。解决每个工作负载独特需求的一种方法是在 SoC 中结合用于信号处理和机器学习的双 MAC 16 位 DSP 和用于程序负载的 Arm Cortex-M CPU

这种混合多核架构利用了 DSP 双内存库、零循环开销和复杂的地址生成。使用它可以处理任何工作负载组合:例如,网络堆栈、RTOS、数字滤波器、时频转换、RNN、CNN 和传统的人工智能类搜索、决策树和线性回归。图 2 显示了当 DSP 架构优势发挥作用时,神经网络计算性能如何提高 2 倍甚至 3 倍。

poYBAGKdVpSACq-QAAEUFeNx8eY351.png

图 2. 矩阵乘法 (NxN) 基准。

仅仅改变架构是不够的

无论是嵌入式视觉系统还是其他依赖显着提高神经网络效率的系统,实现混合多核架构都很重要。然而,当目标是将功耗降低到 mW 范围时,还需要做更多的工作。认识到这一需求,Eta Compute 获得了连续电压和频率缩放 (CVFS) 专利。

CVFS 克服了动态电压频率缩放或 DVFS 遇到的问题。DVFS 确实利用了降低功率的选项,即降低电压。缺点是执行此选项时最大频率会降低。这个问题将 DVFS 的有效性限制在一个狭窄的范围内——一个由严格限制数量的预定义离散电压电平定义,并限制在几百 mV 的电压范围内。

相比之下,为了在最有效的电压下实现一致的 SoC 操作,CVFS 使用自定时逻辑。有了自定时逻辑,每个设备都可以连续自动调整电压和频率。CVFS 比 DVFS 更有效,也比亚阈值设计更容易实施,CVFS 在另一个重要方面也与这些不同。关键区别在于,上面提到的混合多核架构使 CVFS 已经在做的好事成倍增加。

极端边缘的生产级

处于极端边缘的端点,例如用于人员检测的端点,有特定的需求。尽管任何人都可以将已发布的神经网络用于这些物联网端点,但它们并没有优先满足这些需求。使用领先的设计技术优化这些网络可以解决这个问题。

除了使用先进的设计方法之外,我们在 Eta Compute 采用的神经网络优化方法集中在我们的生产级神经传感器处理器 ECM3532(图 3)上。它融合了混合多核架构和 CVFS 技术的所有优点。

poYBAGKdVpyAANjFAAIQrx-fZpc598.png

图 3. Eta Compute ECM3532 神经传感器处理器的混合多核架构,其中将 Arm Cortex-M3 处理器、NXP CoolFlux DSP、512KB 闪存、352KB SRAM 和支持外设集成在 SoC 中,使推理达到极致在可实现的 mW 范围内的边缘。

获得的知识

诸如图 4 所示结果的测试表明,为了将深度学习引入嵌入式视觉系统,电力成本不必上升到不可接受的水平。虽然没有一根魔杖可以为耗电的神经网络提供支持,但一种将 MCU 电源效率和 DSP 优势与网络优化相结合的方法可以帮助应用程序避免仅依赖云计算导致的安全性、延迟和低效率问题。

pYYBAGKdVrKAcTtFAAJSjVjrOyk700.png

图 4. 在人员检测模型的测试中,包括摄像头在内的平均系统功率达到了 5.6mW。对于该测试,速率为每秒1.3次推理,但进一步细化优化应将平均系统功率进一步降低至 4mW,同时将速率提高到每秒 2 次推理。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2939

    文章

    47317

    浏览量

    407795
  • 摄像头
    +关注

    关注

    61

    文章

    5058

    浏览量

    102437
  • 机器视觉
    +关注

    关注

    163

    文章

    4728

    浏览量

    125003
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    学习联网怎么入门?

    随着联网技术的不断发展,越来越多的人开始关注学习这一领域。但是对于初学者来说,联网似乎是一个庞杂的概念,学习起来很困难。因此,从哪里开始学习
    发表于 10-14 10:34

    如何判断电能质量监测装置的数据偏差是否在允许范围内

    LZ-DZ200电能质量在线监测装置 判断电能质量监测装置的数据偏差是否在允许范围内,需结合标准规范、装置精度等级、测量参数类型及实际应用场景(如新能源并网的特殊要求)综合评估,核心是将实测偏差
    的头像 发表于 08-21 09:28 769次阅读
    如何判断电能质量监测装置的数据偏差是否在允许<b class='flag-5'>范围内</b>?

    联网技术促进能量收集创新应用落地

    能量收集并不是一个时兴的名词,但是联网技术的进步以及诸如Silicon Labs的联网产品以及开发套件,使能量收集技术的应用也
    的头像 发表于 07-09 15:07 523次阅读
    <b class='flag-5'>物</b><b class='flag-5'>联网</b>技术促进能量收集创新应用落地

    Aux-Think打破视觉语言导航任务的常规推理范式

    视觉语言导航(VLN)任务的核心挑战,是让机器人在复杂环境中听懂指令、看懂世界,并果断行动。我们系统性地引入推理任务,探索其在导航策略学习中的作用,并首次揭示了VLN中的“推理崩塌”现
    的头像 发表于 07-08 10:00 421次阅读
    Aux-Think打破<b class='flag-5'>视觉</b>语言导航任务的常规<b class='flag-5'>推理</b>范式

    联网蓝牙模块有哪些优势?

    的续航时间。这对于需要长时间运行的联网设备来说,是非常重要的一个优势。传输距离远:相较于其他无线通信技术,蓝牙模块的传输距离较远,可以在100米以内的范围内实现稳定的通信。这使得其在
    发表于 06-28 21:49

    联网的应用范围有哪些?

    的应用范围极其广泛,众多行业都在积极引入这项技术,以提升效率、创新业务模式。 物流行业:在仓储环节,借助联网技术,可实现对货物的实时监测,了解货物的位置、状态等信息,优化仓储空间布局。运输过程中,通过
    发表于 06-16 16:01

    NXP技术白皮书:AIoT人工智能联网 将人工智能与现实世界相连

      分析师将人工智能联网 (AIoT) 大致定义为人工智能 (AI) 与联网(IoT)的融合,利用AI让
    的头像 发表于 03-28 11:53 1818次阅读
    NXP技术白皮书:AIoT人工智能<b class='flag-5'>物</b><b class='flag-5'>联网</b> 将人工智能与现实世界相连

    村田NPO电容在哪些频率范围内具有较好的性能?

    ,以及其在高频电路中的应用优势。 村田NPO电容的基本特性 村田NPO电容是一种具有温度补偿特性的单片陶瓷电容器,其填充介质由铷、钐和一些其他稀有氧化组成。这种电容器在-55℃到125℃的温度范围内,容量变化为0±30ppm/℃,电容量随频率的变
    的头像 发表于 03-17 14:50 906次阅读

    蜂窝联网怎么选

    的数据传输速率。有了蜂窝联网技术,您就不必在功耗和数据传输速率之间做出妥协,而是可以两全其美。 终身成本:虽然某些 LPWAN 技术的前期成本可能看起来很吸引人,但评估整个生命周期的成本(部署
    发表于 03-17 11:46

    为什么选择蜂窝联网

    、Wi-SUN 或其他 LPWAN 相比,蜂窝联网(包括 NB-IoT 和 LTE-M)更适合您的联网项目,以下是其中一些关键原因。 许可与非许可频段: 蜂窝
    发表于 03-17 11:42

    宇树科技在联网方面

    的发展,对传感器的需求不断增加且要求越来越高,宇树科技通过与传感器公司的合作,不断优化和拓展传感器技术在其机器人产品中的应用,使机器人能够更好地适应各种
    发表于 02-04 06:48

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    将自然语言理解与运动规划融为一体。这种端到端的方法使机器人能够直接从人类指令生成动作序列,大幅简化了控制流程。该项目的工作流程包含设计并封装一个人机器人函数库、编写清晰地描述提示词、在仿真环境中执行
    发表于 12-24 15:03

    ad7124上电开启诊断结果,显示LDO不在范围内,是哪里出错了?

    上电开启诊断结果,并输出--串口打印显示 0x80------模拟LDO不在范围内 万用表实际测量有1.89V,是在范围内的; 请问这种情况是芯片坏了?应该不是芯片坏了吧。数据能输出
    发表于 12-19 08:58

    ADS1230怎么处理才能使信号在芯片量程范围内

    要用10-15V电压给重量传感器,那需要怎么处理才能使信号在芯片量程范围内,加运放?且是负反馈?求高手指教,不胜感激
    发表于 12-19 07:01

    请问ldc1101是否能够检测到圆球在摆幅范围内不同位置的相对距离?

    应用场景:线圈在磁性圆球下大约1cm以内,线圈静止,圆球会缓慢水平摆动,摆动幅度约0.5cm。请问ldc1101是否能够检测到圆球在摆幅范围内不同位置的相对距离?
    发表于 12-09 07:04