0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

mW范围内的机器视觉使物联网端点推理变得实用

星星科技指导员 来源:嵌入式计算设计 作者:Semir Haddad 2022-06-06 09:19 次阅读

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,尤其是功率效率。

机器视觉已经迅速在世界上找到了自己的位置。可以看到橙子并从树上摘下橙子。 凝视检测针对危险的无意识驾驶员。在工厂车间周围移动的工业机器人依靠它来进行安全的障碍物检测。

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,尤其是功率效率。可以在不超过节点功率容量的情况下进行极端边缘的推理吗?

这个问题值得考虑。这是因为在边缘进行推理可以避免将数据(只有其中一些是可操作的)不加选择地传输到云端进行分析。这降低了存储成本。此外,云访问会损害延迟并抑制实时能力。旅行数据是易受攻击的数据,因此更可取端点处理。这也有利于降低支付给网络运营商的成本。

SoC 架构的新方法

然而,对于所有这些好处,存在一个主要的绊脚石。使用传统微控制器的设备的功耗限制在极端情况下阻碍了神经网络推理。

传统的微控制器 (MCU) 性能无法满足周期密集型操作。方法唤醒解决方案可能依赖机器视觉进行对象分类,而这又需要卷积神经网络 (CNN) 来执行矩阵乘法运算,从而转化为数百万乘法累加 (MAC) 计算(图 1)。

poYBAGKdVo6ATt8OAADnJcvFMII217.png

图 1. 迄今为止,微控制器无法高效处理大容量乘法累加 (MAC) 的问题一直是一个绊脚石。

MCU 存在各种神经网络。但是,这些解决方案未能成为生产就绪型解决方案,因为所需的性能无法超越功率障碍。

克服电源性能困境是为什么采用全新方法处理处理器角色和 SoC 架构的解决方案是有意义的。采用这种新方法需要了解物联网端点需要处理三个工作负载才能成功进行推理。一种是程序性的,一种是用于数字信号处理的,一种是执行大量 MAC 操作的。解决每个工作负载独特需求的一种方法是在 SoC 中结合用于信号处理和机器学习的双 MAC 16 位 DSP 和用于程序负载的 Arm Cortex-M CPU

这种混合多核架构利用了 DSP 双内存库、零循环开销和复杂的地址生成。使用它可以处理任何工作负载组合:例如,网络堆栈、RTOS、数字滤波器、时频转换、RNN、CNN 和传统的人工智能类搜索、决策树和线性回归。图 2 显示了当 DSP 架构优势发挥作用时,神经网络计算性能如何提高 2 倍甚至 3 倍。

poYBAGKdVpSACq-QAAEUFeNx8eY351.png

图 2. 矩阵乘法 (NxN) 基准。

仅仅改变架构是不够的

无论是嵌入式视觉系统还是其他依赖显着提高神经网络效率的系统,实现混合多核架构都很重要。然而,当目标是将功耗降低到 mW 范围时,还需要做更多的工作。认识到这一需求,Eta Compute 获得了连续电压和频率缩放 (CVFS) 专利。

CVFS 克服了动态电压频率缩放或 DVFS 遇到的问题。DVFS 确实利用了降低功率的选项,即降低电压。缺点是执行此选项时最大频率会降低。这个问题将 DVFS 的有效性限制在一个狭窄的范围内——一个由严格限制数量的预定义离散电压电平定义,并限制在几百 mV 的电压范围内。

相比之下,为了在最有效的电压下实现一致的 SoC 操作,CVFS 使用自定时逻辑。有了自定时逻辑,每个设备都可以连续自动调整电压和频率。CVFS 比 DVFS 更有效,也比亚阈值设计更容易实施,CVFS 在另一个重要方面也与这些不同。关键区别在于,上面提到的混合多核架构使 CVFS 已经在做的好事成倍增加。

极端边缘的生产级

处于极端边缘的端点,例如用于人员检测的端点,有特定的需求。尽管任何人都可以将已发布的神经网络用于这些物联网端点,但它们并没有优先满足这些需求。使用领先的设计技术优化这些网络可以解决这个问题。

除了使用先进的设计方法之外,我们在 Eta Compute 采用的神经网络优化方法集中在我们的生产级神经传感器处理器 ECM3532(图 3)上。它融合了混合多核架构和 CVFS 技术的所有优点。

poYBAGKdVpyAANjFAAIQrx-fZpc598.png

图 3. Eta Compute ECM3532 神经传感器处理器的混合多核架构,其中将 Arm Cortex-M3 处理器、NXP CoolFlux DSP、512KB 闪存、352KB SRAM 和支持外设集成在 SoC 中,使推理达到极致在可实现的 mW 范围内的边缘。

获得的知识

诸如图 4 所示结果的测试表明,为了将深度学习引入嵌入式视觉系统,电力成本不必上升到不可接受的水平。虽然没有一根魔杖可以为耗电的神经网络提供支持,但一种将 MCU 电源效率和 DSP 优势与网络优化相结合的方法可以帮助应用程序避免仅依赖云计算导致的安全性、延迟和低效率问题。

pYYBAGKdVrKAcTtFAAJSjVjrOyk700.png

图 4. 在人员检测模型的测试中,包括摄像头在内的平均系统功率达到了 5.6mW。对于该测试,速率为每秒1.3次推理,但进一步细化优化应将平均系统功率进一步降低至 4mW,同时将速率提高到每秒 2 次推理。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2868

    文章

    41622

    浏览量

    358351
  • 摄像头
    +关注

    关注

    59

    文章

    4608

    浏览量

    92891
  • 机器视觉
    +关注

    关注

    161

    文章

    4043

    浏览量

    118357
收藏 人收藏

    评论

    相关推荐

    在英特尔独立显卡上加速HALCON AI模型推理

    MVTec HALCON 是一款在全球范围内使用,综合性的机器视觉标准软件。它有一个专门的集成开发环境(HDevelop),专门用于开发图像处理解决方案。
    的头像 发表于 12-16 10:18 672次阅读
    在英特尔独立显卡上加速HALCON AI模型<b class='flag-5'>推理</b>

    机器视觉双目测宽仪具体有什么优势?

    、标称宽度、正负公差等;统计的最大、最小宽度及其对应的长度等;测量时显示宽度尺寸波动曲线。当测量数据处于设定的合格范围内时,测量值的数据颜色为绿色;当测量最大厚度偏差超出设定的允许范围时为红色。 产品
    发表于 11-28 17:13

    请问±10V差分信号如何调理到差分ADC可以接受的±2.5V的范围内

    ±10V差分信号如何调理到差分ADC可以接受的±2.5V的范围内?另外采用差分放大器驱动差分ADC时,发现在绝对最大额定值参数中,有个差分输入电压电压,一般比较小,这个参数是不是说明只能输入的差分信号就这么大?
    发表于 11-27 06:06

    全工作频率范围内的运放共模抑制比如何测试?

    全工作频率范围内的运放共模抑制比如何测试?
    发表于 11-17 09:17

    AD5521可以设计满足1~2GHz宽范围内的阻抗匹配吗?

    您好! 我的设计是需要满足在1~2GHz的低噪声放大,当我选用了ADL5521后,在ADL5521datasheet发现典型电路做输入匹配时貌似并不能满足在1~2GHz宽范围内的匹配,而是
    发表于 11-17 07:51

    联网专业前景怎么样?

    联网专业前景怎么样? 联网专业在当今技术发展迅速的背景下具有广阔的前景。以下是联网专业的
    发表于 10-20 09:48

    MCU是怎么为联网端点设备提高安全性的?

    MCU 是怎么为联网端点设备提高安全性的?
    发表于 10-17 08:53

    基于飞腾派的边缘联网

    本帖最后由 zhh763984017 于 2023-9-21 16:53 编辑 今天给大家分享一个飞腾派的一个应用场景——边缘联网关。边缘联网关可以连接各种
    发表于 09-21 16:50

    阿里云联网平台基础概念讲解

    产品 设备的集合,通常指一组具有相同功能的设备。联网平台为每个产品颁发全局唯一的ProductKey。每个产品下可以有成千上万的设备。 设备 归属于某个产品下的具体设备。联网
    发表于 09-11 07:41

    联网简介

    联网(IoT)是由物理设备、车辆等组成的网络,家用电器和嵌入有电子设备、软件、传感器等的其他物品,致动器,以及使这些物体能够连接和交换数据。
    发表于 09-11 07:18

    乐鑫Mesh组网方案ESP-Mesh-Lite支持大范围内联网

    乐鑫科技 (688018.SH) 基于 Wi-Fi 协议推出了 Mesh 组网方案 ESP-Mesh-Lite,支持更多设备在更大范围内轻松联网
    的头像 发表于 09-08 14:15 1265次阅读
    乐鑫Mesh组网方案ESP-Mesh-Lite支持大<b class='flag-5'>范围内联网</b>

    机器视觉属于人工智能吗?和人视觉相比,有什么优缺点?

    ,通过对图像或视频数据的分析和理解,实现对物体、场景和动作的识别、理解和推理机器视觉在人工智能领域扮演重要的角色,它将传感器和相机等图像采集设备与算法和模型相结合,
    的头像 发表于 08-09 08:09 2773次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>视觉</b>属于人工智能吗?和人<b class='flag-5'>视觉</b>相比,有什么优缺点?

    一个典型工业机器视觉系统的基本构造

    机器视觉:用于指引机器人在大范围内的操作和行动,如从料斗送出的杂乱工件堆中拣取工件并按一定的方位放在传输带或其他设备上(即料斗拣取问题)。至于小
    发表于 06-26 19:25 574次阅读
    一个典型工业<b class='flag-5'>机器</b><b class='flag-5'>视觉</b>系统的基本构造

    基于机智云联网平台的智能种树小车

    4 试验测试 传统的种树机器,只能够针对种树中的某一个环节,无法真正实现全自动化种树。相较于大型的植树设备,该种树小车在确保功能完整的情况下,合理设计,实现了体积最小化的目标。联网机器
    发表于 05-31 19:38

    扒一扒那些在联网中比较常用的无线短距离通信语言及技术

    应用。Z-Wave工作频率美国908.42MHz、欧洲868.42MHz,采用无线网状网络技术,因此任何节点都能直接或间接地和通信范围内的其它临近节点通信。数据速率包括9.6kbps和40kbps.输出功率为1mW
    发表于 05-11 11:27