0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何在边缘AI应用场景中实现高性能、低功耗推理(下)

瑞萨嵌入式小百科 来源:瑞萨电子 2026-02-26 15:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

续接上篇,我们一起看看RA8P1如何通过两个应用示例帮助简化AI实现。

应用示例1:RA8P1上的图像分类

bd1cb99a-11ff-11f1-90a1-92fbcf53809c.png

图 4:图像分类系统框图

上图显示了图像分类应用程序实现。RA8P1将构建此视觉AI应用程序所需的CPU内核、NPU、内存和外设集成在单个芯片上。应用程序会分析输入图像并为其分配预先分配的标签或类别。神经网络模型在庞大的图像数据集上进行训练(其中每张图像都标有类别),并部署在RA8P1 MCU上。

为了进行推理,将新的输入图像输入到模型中,并通过经过训练的网络的各层。然后,输出层提供所有类别的概率分布,并将概率最高的类别分配为图像的标签。然后,可以将此输出数据(图像标签和准确性)发送到显示器或云。在我们的实施中,我们看到与使用CPU内核相比,使用Ethos-U55的推理速度提高了33倍。

bd993434-11ff-11f1-90a1-92fbcf53809c.png

图 5:RA8P1上的图像分类和性能比较,NPU与CPU

图像分类可用于各种应用:

安全–危险品识别、人员识别、异常检测

零售–按类别创建产品目录、库存管理

农业–识别作物病害、植物分类

智慧城市–识别交通信号灯/标志和行人

智能电器–识别冰箱内的物体

应用示例 2:RA8P1上的驾驶员监控系统

此应用程序展示了Nota-AI驾驶员监控系统(DMS),这是一种车内安全解决方案,旨在增强车辆行驶各个方面的道路安全。使用RA8P1,Nota-ai DMS可以检测未注册的驾驶员、驾驶员疲劳、手机使用情况以及驾驶员分心(如吸烟)的情况。

随着RA8P1的更高性能,我们看到该应用中使用的四种模型(人脸检测、人脸特征点、眼睛特征点和手机检测)的推理性能提高了4到24倍。

DMS可用于仪表板摄像头、车辆行驶数据记录仪和驾驶员监控系统。

be11af4a-11ff-11f1-90a1-92fbcf53809c.png

图 6:RA8P1上的驾驶员监控系统NPU与CPU性能比较

这两个视觉AI应用程序都充分利用了RA8P1 MCU上的资源:

通过图像传感器进行高效的输入图像采集:

RA8P1包括一个专用的MIPI CSI-2接口,带有图像缩放单元或16位CEU并行摄像头接口,用于捕获原始图像输入数据。

使用Ethos-U55 NPU进行高性能推理处理:

RA8P1 MCU上的Ethos-U55 AI加速器可分担CPU内核工作,并比CPU内核更高效、更低功耗地处理复杂的AI模型。它从MIPI CSI-2或并行CEU接收处理后的图像。

预先训练的AI模型(例如,像MobileNetv1这样的图像分类模型)使用RUHMI工具针对RA8P1进行了优化,并加载到NPU上。

Ethos-U55 NPU以非常高的速度(高达256 GOPS)和高功效执行实际的AI推理。

使用Arm Cortex-M85和Cortex-M33加快应用程序处理速度

带有Arm Helium矢量扩展的高性能1GHz CM85内核可用于输入图像或音频数据以及推理结果的预处理和后处理。Ethos-U55不支持的运算符也可以由CM85内核在回退模式下执行,由CMSIS-NN库加速。它还用于执行应用程序代码

250MHz Cortex-M33内核可用于低功耗唤醒和内务管理任务。

通过片上存储器和存储器接口高效存储图像、模型权重和激活:

片上大型1MB MRAM和2MB SRAM对于存储AI模型权重、图像和中间激活至关重要。 与闪存相比,集成的嵌入式MRAM具有更快的写入速度、更高的耐用性和数据保持率等优势。

MCU还支持适用于更大模型的高吞吐量外部存储器接口(具有XIP和动态解密的OSPI以及32位SDRAM)。

用于LCD面板的高级图形外设:

GLCDC(具有并行RGB或MIPI DSI接口)和2D引擎可用于处理图像和推理结果并将其渲染到LCD显示器上。

灵活的连接选项:

存在多种连接选项,可将推理结果、图像或警报/通知传输到本地设备或云,以进行存储或分析。

边缘AI应用从AI加速MCU的使用中受益匪浅。它们在实时性、低功耗和安全性重要的应用场景具有关键价值。低功耗MCU的加入是AI解决方案领域的一个变革性变化。

全新RA8P1 MCU大幅降低延迟,实现数据隐私并最大限度地降低功耗,使其成为电池供电应用的理想选择。整个开发由瑞萨电子的全面RUHMI框架提供支持,该框架可帮助开发人员在RA8P1硬件上高效优化和部署其AI模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 瑞萨电子
    +关注

    关注

    39

    文章

    2974

    浏览量

    74382
  • 边缘AI
    +关注

    关注

    0

    文章

    240

    浏览量

    6155

原文标题:如何在边缘AI应用场景中实现高性能、低功耗推理(下)

文章出处:【微信号:瑞萨嵌入式小百科,微信公众号:瑞萨嵌入式小百科】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    检索。 这一组合带来了高达176TOPS的整型AI算力(INT8)。在AI硬件行业,算力决定了应用的天花板: 算力区间 典型应用场景 设备形态 10-40 TOPS 单路视觉识别、轻
    发表于 03-10 14:19

    如何确保CAT.1模组的高性能低功耗

    确保CAT.1模组实现高性能低功耗的完美平衡,是物联网设备长期稳定运行和降低运维成本的关键。基于我们采用的华为海思最新Hi2131芯片方案,我们通过以下四大核心技术维度实现了这一目标
    发表于 03-05 11:41

    何在边缘AI用场景实现高性能低功耗推理(上)

    送回EndPoint设备。这种方法需要巨大的带宽才能将海量数据传输到云端。边缘设备越来越多地使用AI推理技术,以实现快速实时响应并提高数据隐私和安全性,同时避免与云连接产生的延迟
    的头像 发表于 03-03 14:18 5353次阅读
    如<b class='flag-5'>何在</b><b class='flag-5'>边缘</b><b class='flag-5'>AI</b>应<b class='flag-5'>用场景</b><b class='flag-5'>中</b><b class='flag-5'>实现</b><b class='flag-5'>高性能</b>、<b class='flag-5'>低功耗</b><b class='flag-5'>推理</b>(上)

    何在边缘AI用场景实现高性能低功耗推理(上)

    。这种方法需要巨大的带宽才能将海量数据传输到云端。 边缘设备越来越多地使用AI推理技术,以实现快速实时响应并提高数据隐私和安全性,同时避免与云连接产生的延迟和成本。这也降低了
    的头像 发表于 02-27 07:48 9175次阅读
    如<b class='flag-5'>何在</b><b class='flag-5'>边缘</b><b class='flag-5'>AI</b>应<b class='flag-5'>用场景</b><b class='flag-5'>中</b><b class='flag-5'>实现</b><b class='flag-5'>高性能</b>、<b class='flag-5'>低功耗</b><b class='flag-5'>推理</b>(上)

    使用NORDIC AI的好处

    原始传感器数据,可显著降低功耗、延长电池寿命。[Edge AI 概述; Nordic Edge AI 技术页] 降低云依赖与时延 直接在设备上做推理,很多决策可以“本地实时”完成,
    发表于 01-31 23:16

    基于NVIDIA模组与软件套件推动边缘与机器人AI推理

    NVIDIA 正式推出 NVIDIA Jetson T4000,将高性能 AI 与实时推理能力带入更广泛的机器人和边缘 AI 应用。T400
    的头像 发表于 01-14 09:46 557次阅读
    基于NVIDIA模组与软件套件推动<b class='flag-5'>边缘</b>与机器人<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    蓝牙网关是什么?都有哪些功能?应用场景有哪些?

    。 安全防护机制:采用AES-128加密、安全配对、HTTPS传输等技术,防范数据泄露与恶意攻击,满足医疗、工业等敏感场景需求。 应用场景 凭借灵活部署与低功耗优势,蓝牙网关已在多领域实现
    发表于 12-11 15:21

    工业视觉网关:RK3576赋能多路检测与边缘AI

    ~150ms6TOPS NPU 边缘AI推理易对接 MES / 追溯系统 一、产线痛点:从“人看”到“机判”的转变· 多工位/多角度同步:单机位覆盖不足,典型项目需 8~12 路并发,且画面时序一致性要求高
    发表于 10-16 17:56

    RK3576助力智慧安防:8路高清采集与AI识别

    全屏/分屏切换,4G、Wi-Fi、双千兆以太网实现实时推流。3. 米尔RK3576核心板平台优势强大的算力:6TOPS NPU高性能:8路视频+AI识别同时运行,CPU占用率仅34%低功耗
    发表于 08-22 17:41

    高性能低功耗双核Wi-Fi6+BLE5.3二合一

    随着物联网技术的不断发展,无线通信模块在各种应用场景扮演着越来越重要的角色。近日,蓝科迅通科技宣布推出一款基于Nordic Semiconductor的Wi-Fi 6芯片nRF7002和高性能双核
    发表于 06-28 21:42

    PTR54L15系列低功耗无线多协议模组

    设备到工业自动化和健康医疗穿戴设备,PTR54L15的灵活性与高性能使其成为边缘计算的理想选择。例如:智能家居:通过Matter协议实现跨品牌设备互联;工业传感器:借助低功耗与高算力
    发表于 06-28 21:23

    低功耗Wi-Fi 6模块物联网:NRF7002

    在智能终端爆发式增长的背景,迅通科技推出的‌PTR7002超低功耗Wi-Fi 6模块‌,凭借其高性能和紧凑设计,迅速成为物联网设备开发者的关注焦点。这款模块不仅适配智能家居、工业自动化等场景
    发表于 05-21 17:10

    能效比达2TOPS/W!解密边缘AI芯片低功耗设计之法

    电子发烧友网报道(文/李弯弯)边缘AI芯片低功耗设计是其在移动设备、物联网终端等资源受限场景中落地的关键。在物联网、可穿戴设备、智能家居等对功耗
    的头像 发表于 05-17 00:07 4550次阅读

    RK3588核心板在边缘AI计算的颠覆性优势与场景落地

    推理任务,需额外部署GPU加速卡,导致成本与功耗飙升。 扩展性受限:老旧接口(如USB 2.0、百兆网口)无法支持5G模组、高速存储等现代外设,升级困难。 开发周期长:BSP适配不完善,跨平台AI
    发表于 04-15 10:48

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    RZ/V2N——近期在嵌入式世界2025上新发布,为 AI 计算、嵌入式系统及工自动化提供强大支持。这款全新的计算平台旨在满足开发者和企业用户对高性能低功耗和灵活扩展的需求。 []() 领先的计算
    发表于 03-19 17:54