0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何在边缘AI应用场景中实现高性能、低功耗推理(下)

RA生态工作室 2026-03-11 16:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

续接上篇,我们一起看看RA8P1如何通过两个应用示例帮助简化AI实现。

应用示例1:RA8P1上的图像分类


ed8d4f74-1d24-11f1-96ea-92fbcf53809c.png

图 4:图像分类系统框图


上图显示了图像分类应用程序实现。RA8P1将构建此视觉AI应用程序所需的CPU内核、NPU、内存和外设集成在单个芯片上。应用程序会分析输入图像并为其分配预先分配的标签或类别。神经网络模型在庞大的图像数据集上进行训练(其中每张图像都标有类别),并部署在RA8P1 MCU上。


为了进行推理,将新的输入图像输入到模型中,并通过经过训练的网络的各层。然后,输出层提供所有类别的概率分布,并将概率最高的类别分配为图像的标签。然后,可以将此输出数据(图像标签和准确性)发送到显示器或云。在我们的实施中,我们看到与使用CPU内核相比,使用Ethos-U55的推理速度提高了33倍。


ed9cca80-1d24-11f1-96ea-92fbcf53809c.png

图 5:RA8P1上的图像分类和性能比较,NPU与CPU


图像分类可用于各种应用:

安全–危险品识别、人员识别、异常检测

零售–按类别创建产品目录、库存管理

农业–识别作物病害、植物分类

智慧城市–识别交通信号灯/标志和行人

智能电器–识别冰箱内的物体

应用示例 2:RA8P1上的驾驶员监控系统

此应用程序展示了Nota-AI驾驶员监控系统(DMS),这是一种车内安全解决方案,旨在增强车辆行驶各个方面的道路安全。使用RA8P1,Nota-ai DMS可以检测未注册的驾驶员、驾驶员疲劳、手机使用情况以及驾驶员分心(如吸烟)的情况。


随着RA8P1的更高性能,我们看到该应用中使用的四种模型(人脸检测、人脸特征点、眼睛特征点和手机检测)的推理性能提高了4到24倍。


DMS可用于仪表板摄像头、车辆行驶数据记录仪和驾驶员监控系统。


edae346e-1d24-11f1-96ea-92fbcf53809c.png

图 6:RA8P1上的驾驶员监控系统NPU与CPU性能比较


这两个视觉AI应用程序都充分利用了RA8P1 MCU上的资源:

通过图像传感器进行高效的输入图像采集:

RA8P1包括一个专用的MIPI CSI-2接口,带有图像缩放单元或16位CEU并行摄像头接口,用于捕获原始图像输入数据。


使用Ethos-U55 NPU进行高性能推理处理:

RA8P1 MCU上的Ethos-U55 AI加速器可分担CPU内核工作,并比CPU内核更高效、更低功耗地处理复杂的AI模型。它从MIPI CSI-2或并行CEU接收处理后的图像。

预先训练的AI模型(例如,像MobileNetv1这样的图像分类模型)使用RUHMI工具针对RA8P1进行了优化,并加载到NPU上。

Ethos-U55 NPU以非常高的速度(高达256 GOPS)和高功效执行实际的AI推理。


使用Arm Cortex-M85和Cortex-M33加快应用程序处理速度

带有Arm Helium矢量扩展的高性能1GHz CM85内核可用于输入图像或音频数据以及推理结果的预处理和后处理。Ethos-U55不支持的运算符也可以由CM85内核在回退模式下执行,由CMSIS-NN库加速。它还用于执行应用程序代码

250MHz Cortex-M33内核可用于低功耗唤醒和内务管理任务。


通过片上存储器和存储器接口高效存储图像、模型权重和激活:

片上大型1MB MRAM和2MB SRAM对于存储AI模型权重、图像和中间激活至关重要。 与闪存相比,集成的嵌入式MRAM具有更快的写入速度、更高的耐用性和数据保持率等优势。

MCU还支持适用于更大模型的高吞吐量外部存储器接口(具有XIP和动态解密的OSPI以及32位SDRAM)。


用于LCD面板的高级图形外设:

GLCDC(具有并行RGB或MIPI DSI接口)和2D引擎可用于处理图像和推理结果并将其渲染到LCD显示器上。


灵活的连接选项:

存在多种连接选项,可将推理结果、图像或警报/通知传输到本地设备或云,以进行存储或分析。


Nota-AI驾驶员监控系统

https://www.renesas.cn/zh/products/microcontrollers-microprocessors/ra-cortex-m-mcus/ra-partners/nota-ai-dms

边缘AI应用从AI加速MCU的使用中受益匪浅。它们在实时性、低功耗和安全性重要的应用场景具有关键价值。低功耗MCU的加入是AI解决方案领域的一个变革性变化。


全新RA8P1 MCU大幅降低延迟,实现数据隐私并最大限度地降低功耗,使其成为电池供电应用的理想选择。整个开发由瑞萨电子的全面RUHMI框架提供支持,该框架可帮助开发人员在RA8P1硬件上高效优化和部署其AI模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • mcu
    mcu
    +关注

    关注

    147

    文章

    19063

    浏览量

    402194
  • 监控系统
    +关注

    关注

    21

    文章

    4184

    浏览量

    185097
  • 图像分类
    +关注

    关注

    0

    文章

    97

    浏览量

    12522
  • 边缘AI
    +关注

    关注

    0

    文章

    257

    浏览量

    6209
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    何在边缘AI用场景实现高性能低功耗推理

    续接上篇,我们一起看看RA8P1如何通过两个应用示例帮助简化AI实现。 应用示例1:RA8P1上的图像分类 图 4:图像分类系统框图 上图显示了图像分类应用程序实现。RA8P1将构建此视觉AI
    的头像 发表于 02-26 15:53 6246次阅读
    如<b class='flag-5'>何在</b><b class='flag-5'>边缘</b><b class='flag-5'>AI</b>应<b class='flag-5'>用场景</b><b class='flag-5'>中</b><b class='flag-5'>实现</b><b class='flag-5'>高性能</b>、<b class='flag-5'>低功耗</b><b class='flag-5'>推理</b>(<b class='flag-5'>下</b>)

    何在边缘AI用场景实现高性能低功耗推理(上)

    送回EndPoint设备。这种方法需要巨大的带宽才能将海量数据传输到云端。边缘设备越来越多地使用AI推理技术,以实现快速实时响应并提高数据隐私和安全性,同时避免与云连接产生的延迟
    的头像 发表于 03-03 14:18 6545次阅读
    如<b class='flag-5'>何在</b><b class='flag-5'>边缘</b><b class='flag-5'>AI</b>应<b class='flag-5'>用场景</b><b class='flag-5'>中</b><b class='flag-5'>实现</b><b class='flag-5'>高性能</b>、<b class='flag-5'>低功耗</b><b class='flag-5'>推理</b>(上)

    何在边缘AI用场景实现高性能低功耗推理(上)

    。这种方法需要巨大的带宽才能将海量数据传输到云端。 边缘设备越来越多地使用AI推理技术,以实现快速实时响应并提高数据隐私和安全性,同时避免与云连接产生的延迟和成本。这也降低了
    的头像 发表于 02-27 07:48 1w次阅读
    如<b class='flag-5'>何在</b><b class='flag-5'>边缘</b><b class='flag-5'>AI</b>应<b class='flag-5'>用场景</b><b class='flag-5'>中</b><b class='flag-5'>实现</b><b class='flag-5'>高性能</b>、<b class='flag-5'>低功耗</b><b class='flag-5'>推理</b>(上)

    NanoEdge AI的技术原理、应用场景及优势

    能耗并提高数据安全性。本文将对 NanoEdge AI 的技术原理、应用场景以及优势进行综述。 1、技术原理 NanoEdge AI 的核心技术包括边缘计算、神经网络压缩和
    发表于 03-12 08:09

    AI赋能边缘网关:开启智能时代的新蓝海

    ,可完成电力负荷精准预测、故障快速定位。据市场研究机构预测,到2025年,AI边缘网关市场规模将突破千亿美元,年复合增长率超过60%。 产业新机遇已经显现。对于硬件制造商,需要开发更高性能、更
    发表于 02-15 11:41

    PTR54L15系列低功耗无线多协议模组

    设备到工业自动化和健康医疗穿戴设备,PTR54L15的灵活性与高性能使其成为边缘计算的理想选择。例如:智能家居:通过Matter协议实现跨品牌设备互联;工业传感器:借助低功耗与高算力
    发表于 06-28 21:23

    高性能低功耗双核Wi-Fi6+BLE5.3二合一

    随着物联网技术的不断发展,无线通信模块在各种应用场景扮演着越来越重要的角色。近日,蓝科迅通科技宣布推出一款基于Nordic Semiconductor的Wi-Fi 6芯片nRF7002和高性能双核
    发表于 06-28 21:42

    如何确保CAT.1模组的高性能低功耗

    确保CAT.1模组实现高性能低功耗的完美平衡,是物联网设备长期稳定运行和降低运维成本的关键。基于我们采用的华为海思最新Hi2131芯片方案,我们通过以下四大核心技术维度实现了这一目标
    发表于 03-05 11:41

    NVIDIA 在首个AI推理基准测试中大放异彩

    的BERT、GNMT 和Jasper 等AI模型开源优化帮助开发者实现顶尖推理性能。NVIDIA的客户和合作伙伴包括有会话式AI领域的一流
    发表于 11-08 19:44

    EdgeBoard FZ5 边缘AI计算盒及计算卡

    ` 随着应用场景的多样化,利用人工智能技术在边缘侧部署一系列创新应用解决方案,对企业传统的业务形态进行升级,加速业务增长,增强竞争优势,起着至关重要的作用。 在市场需求和产业趋势的推动,米尔
    发表于 08-31 14:12

    怎么实现低功耗单芯片高性能音频CODEC的设计?

    CJC89888芯片特点是什么?低功耗芯片设计要点是什么?怎么实现低功耗单芯片高性能音频CODEC的设计?
    发表于 06-03 06:27

    蓝牙低功耗常见的应用场景及架构

    浅谈蓝牙低功耗(BLE)的几种常见的应用场景及架构
    发表于 06-15 09:51

    基于ZU3EG的低功耗高性能嵌入式AI高性能计算模组

    基于ZU3EG的低功耗高性能嵌入式AI高性能计算模组 ![在这里插入图片描述](?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVp
    发表于 12-14 08:38

    嘉楠勘智K510开发板简介——高精度AI边缘推理芯片及应用

    的支持此功能的端侧芯片之一。嘉楠勘智的第1代AI加速芯片自上市以来,以其低价格、高性能、外围器件少、使用简单等特性,深受广大AI爱好者所喜爱,成为不少人踏入边缘
    发表于 11-22 15:52

    汽车的各种ECU,如何实现低功耗高性能

    高性能低功耗是当前电子技术发展的方向,对于汽车的各种ECU来说如何实现低功耗呢?
    的头像 发表于 01-03 08:34 1.9w次阅读