0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用RZ/V微处理器进行AI评估

星星科技指导员 来源:瑞萨电子 作者: Shingo Kojima 2022-04-24 09:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

你有没有被问过,“你不能用人工智能来提高我们系统的性能吗?”

或者,“你能否通过将人工智能融入我们的设备来为我们的设备增加更多价值?”

人工智能、深度学习神经网络……人工智能应用正在呈指数级扩展,没有一天不听这些话。另外,有很多人有同样的想法——“我很感兴趣,但即使我研究了一点,我也不太明白如何使用它。我不知道如何在我的工作中使用它,我无法想象它会给我的工作带来什么价值。”

在这篇博客中,我想介绍使用瑞萨嵌入式 AI 处理器 - RZ/V 系列的软件包进行 AI 评估。

什么是人工智能?

如果您已经熟悉 AI 和深度学习,这可能没有必要,但我想先回顾一下有关 AI 的一些基础知识。

人工智能 (AI)。许多书籍和网站都以各种方式解释了这一点,例如人工智能可以像专业人士一样下棋,或者只需要求它打开房间里的灯。但是,我想专注于人工智能的最狭义定义:使用神经网络技术的人工智能,特别是——视觉人工智能——可以对图像进行各种识别和判断。

神经网络。如图 1 所示,生物体大脑中的神经接收来自多个其他神经元的输入,并将它们传送到下一个神经元。众所周知,记忆、识别和判断是基于两种信号的组合:来自输入侧的信号被使用的强度(加权)以及加权后每个输入的总和如何传输到输出侧(激活功能)。

使用神经网络的人工智能模仿这种机制,通过大量的算术处理来进行各种识别和判断,例如对多个输入进行加权、求和,然后通过激活函数将结果传递到下一个阶段。

以 3x3 卷积运算为例,它经常在 Vision AI 中用于量化输入图像的特征。图像首先被细分为 3 像素 x 3 像素的图像。对每个值(像素密度)进行加权,并使用激活函数将这些值的总和作为输出值发送到下一个阶段。(图2)

poYBAGJkqmyAXVhTAADXseMjFW4097.jpg

图 2 神经网络的 3x3 卷积运算示例

这个过程首先在输入图像的整个表面上进行,然后是由输出创建的下一个图像(因此它不完全是已经可以看作图像的数据,它被称为 - 特征值,这意味着抽象输入图像特征的数据)被发送到下一个重复相同过程的神经网络。

即使是简单的图像识别,比如区分数字和字母,也需要几层这样的计算,而一般的物体识别需要几十层这样的计算,所以通过重复无数次的操作,我们就可以实现图像识别,比如确定数字5 是 5 或从狗的图像中识别狗的位置。

简而言之,最大的区别在于没有人工智能的传统计算机软件——人们思考他们想要处理什么(算法)并构建程序——而使用神经网络的人工智能——使用大量输入和自动准备处理所需的内部数据(加权参数)。换句话说,在人工智能中,主角不是程序,而是数据。因此,虽然传统的软件开发侧重于编程,但人工智能开发中最重要和最耗时的部分是准备加权参数(学习)的过程,以便它能够以必要的精度和速度。

我们在此介绍的 AI 评估软件包使用了 PyTorch 等 AI 框架提供的预训练模型,因此您可以评估 AI 的图像推理执行情况,而无需耗时的学习过程。

让我们考虑一个视觉 AI 评估的具体说明。

需要什么?

无需从一开始就购买评估板。在这篇博客中,我将帮助您体验嵌入式 AI 处理器 RZ/V 系列的 Vision AI 实现流程,仅使用免费的开源软件(以下简称 OSS)和瑞萨电子在网络上免费提供的软件包。

pYYBAGJkqm2ASVvhAAB2rGAggrI725.jpg

*1 PyTorch、PyTorch 徽标和任何相关标记是 Facebook, Inc. 的商标。

*2 TensorFlowTensorFlow 徽标和任何相关标记是 Google Inc. 的商标。

*3 DRP-AI Translator:瑞萨电子的 ONNX 转换工具

图 3 RZ/V2L AI实现工具流程整体架构

图 3 显示了整个工具流程。人工智能学习有各种行业标准框架,大家熟悉,所以我们开发了RZ/V系列,“你可以使用现有的你熟悉的人工智能框架进行人工智能训练,将训练好的神经网络模型连接到瑞萨工具使用一种称为 ONNX 的通用格式,”——这是一种 AI 开发流程。ONNX 是一种被广泛采用的格式,大多数 AI 框架都能够直接输出或使用转换工具以 ONNX 格式输出,但我们将使用 AI 框架 PyTorch 作为示例。

在 AI 世界中,Linux 而非 Windows 是事实上的标准,这里使用的所有操作系统和软件包也需要安装 Linux(Ubuntu)的 PC。

有一种称为 WSL2 的技术可以在 Windows 上将 Linux 作为虚拟操作系统运行,但瑞萨评估包不保证可以与 WSL2 一起使用,因此请准备一台安装了 Ubuntu 的 PC。如果你不打算做 AI 学习,你不需要高性能,所以你也可以重复使用手头的旧 PC。

首先,一台 Linux PC 和 DRP-AI 支持包

准备好 Linux PC

对于硬件,您可以使用您自己的带有 x86 64 位 CPU 和至少 6GB RAM 的 PC,但操作系统不是 Windows。我们将改为使用 Linux 发行版之一的 Ubuntu 版本 18.04。

转到提供 Uubuntu 18.04 的网页并从ubuntu-18.04.6-desktop-amd64.iso下载 ISO 文件。

您可以使用适用于 Windows 的 Rufus 工具将 ISO 文件转换为可引导的 USB 驱动器,以便您可以在计划安装 Ubuntu 的 PC 上安装 Ubuntu 18.04。

(有关使用 Rufus 的详细信息,请参阅 https://rufus.ie/en/ 。)

准备好软件

要下载软件,首先从瑞萨电子网站下载软件包“ RZ/V2L DRP-AI Support Package ”。该文件是一个超过 2GB 的大型 ZIP 文件,因此我们建议通过高速互联网连接下载它。

解压此 ZIP 文件时,打开文件夹 rzv2l_ai-implementation-guide,您将在其中找到文件

rzv2l_ai-implementation-guide_en_rev5.00.pdf(以下简称“实施指南”)。

本指南以分步练习的形式编写。如果您遵循它,您将能够评估包含的经过训练的神经网络模型,从转换到评估板上的实际操作。接下来,我想介绍一些在使用本指南进行评估时需要考虑的要点。

poYBAGJkqm2ATPFXAABwIIx1jpk753.jpg

图 4 DRP-AI 支持包详情

创建 ONNX 文件

从这里开始,我们将在 Linux 中使用命令行。

(如果您是 Linux 新手,则需要学习操作系统本身的基本命令。)

AI 框架 PyTorch 和 torchvision 也可以使用命令 pip3 从 Linux 命令行安装。(请参阅实施指南,第 2.2 章,第 26 页)

在您下载的 DRP-AI 支持包中,您会找到 rzv2l_ai-implementation-guide_ver5.00.tar.gz 压缩文件。按照实施指南中的说明解压缩文件。(第 30 页)

同样,在名为 pytorch_mobilenet 的文件夹中,在 rzv2l_ai-implementation-guide 下,您将找到文件

pytorch_mobilenet_en_rev5.00.pdf(以下简称 MobileNet 指南)和 pytorch_mobilenet_ver5.00.tar.gz,您应该按照实施指南。

MobileNet 是为移动和嵌入式设备开发的用于图像识别的轻量级快速神经网络,它输出图像中对象正确答案的概率。例如,如图5所示,物体是小猎犬的概率为93.53%,说明判断正确。

pYYBAGJkqm2AIMHcAABf6Qme5LE873.jpg

图 5 MobileNet的图像识别图像

如果您继续阅读 pytorch_mobilenet_en_rev5.00.pdf 的第 2 章,您将找到一个名为 mobilenet_v2.onnx 的文件。这是具有 ONNX 格式的加权参数的预训练 MobileNet v2 神经网络模型的表示。

现在我们已经有了经过训练的 ONNX 文件,让我们进入下一阶段,为 DRP-AI 创建 DRP-AI 对象文件并评估性能。

在 DRP-AI Translator 中转换为 DRP-AI 对象文件

从这里开始,我们将使用 Renesas 的 ONNX 转换工具 DRP-AI Translator。首先,从 Renesas 网站下载DRP-AI Translator 。

根据实施指南的第 3.1 章安装解压缩的安装程序。如果您按照实施指南和 MobileNet 指南中的步骤操作,您最终应该会得到如图 6 所示的目录结构。

poYBAGJkqm2AFpvlAAA8JlMhpb8484.jpg

图 6 ONNX 文件的目录结构和 DRP-AI 转换器目录结构

在此之后,通过复制/重命名和编辑样本中的文件,准备要输入到 DRP-AI 翻译器的文件。有关详细说明,请参阅 MobileNet 指南第 3.3-3.5 章。

准备好后,ONNX 转换本身可以通过一个命令完成。对于 RZ/V2L,从 shell 运行

$ 。/run_DRP-AI_translator_V2L.sh mobilenet_v2 -onnx 。/onnx/mobilenet_v2.onnx

在工作目录下的 output/mobilenet_v2/ 目录中,这将生成在真实芯片上运行 MobileNet 所需的二进制文件。(图 7)

pYYBAGJkqm2AesSiAACQjOtY_OU098.jpg

图 7 运行 DRP-AI Translator 后的文件列表

如何阅读性能估算器 Excel

除了评估实际设备所需的对象外,DRP-AI 转换器还输出神经网络模型的摘要,该模型从 ONNX 转换为 Excel 格式。(图 8)

连同神经网络模型的结构信息,此 Excel 文件包含模型每一层(每个功能)的大致处理时间(DRP-AI 单机性能,不包括 LSI 内部总线和外部 DRAM 带宽的限制) ,它允许您估计近似性能。

poYBAGJkqm2AGaIGAAElkVqn8ow537.jpg

图 8 mobilenet_v2_summary.xlsx 示例

概括

我们为对AI感兴趣但不知从何下手的用户介绍了瑞萨电子提供的免费软件包,大家可以试试。如果您拥有本博客中创建的目标文件,那么您离使用真实芯片评估 AI 性能又近了一步。本博客使用的RZ/V2L的评估板套件已经可以购买,您可以体验到评估板套件中嵌入的实际芯片的AI性能、低功耗和低发热。

瑞萨嵌入式 AI 处理器的 RZ/V 系列还包括RZ/V2M ,其 AI 性能比这里介绍的RZ/V2L高约 1.5 倍,并且提供RZ/V2M DRP-AI Support Package,可用于与上面提到的方法相同。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    246935
  • 嵌入式
    +关注

    关注

    5186

    文章

    20143

    浏览量

    328646
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296316
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于瑞萨RZ/G2L微处理器的Ubuntu系统移植指南

    RZ/G2L微处理器配备Cortex-A55(1.2GHz)CPU、16位DDR3L/DDR4接口、带Arm Mali-G31的3D图形加速引擎以及视频编解码(H.264)。此外,这款微处理
    的头像 发表于 10-15 06:53 7612次阅读
    基于瑞萨<b class='flag-5'>RZ</b>/G2L<b class='flag-5'>微处理器</b>的Ubuntu系统移植指南

    瑞萨电子RZ/V系列微处理器助力边缘AI开发

    边缘AI越来越多地应用于诸如工业摄像头和公共设施摄像头等嵌入式设备中,并要求嵌入式产品小型化且具有低功耗。瑞萨电子RZ/V系列微处理器(MPU)内置
    的头像 发表于 09-23 10:31 568次阅读
    瑞萨电子<b class='flag-5'>RZ</b>/<b class='flag-5'>V</b>系列<b class='flag-5'>微处理器</b>助力边缘<b class='flag-5'>AI</b>开发

    瑞萨RZ/G2UL微处理器引脚复用分析方法

    RZ/G2UL微处理器配备Cortex-A55(1.0 GHz)CPU、16位DDR3L/DDR4接口以及简单的LCD控制。此外,这款微处理器还配备有大量接口,如摄像头输入、显示输出
    的头像 发表于 06-19 11:16 1589次阅读
    瑞萨<b class='flag-5'>RZ</b>/G2UL<b class='flag-5'>微处理器</b>引脚复用分析方法

    RZ/V2N中档嵌入式AI MPU 数据手册和产品介绍

    Renesas Electronics RZ/V2N中档嵌入式AI微处理器 (MPU) 设计用于提供强大的人工智能 (AI)性能和出色的效率
    的头像 发表于 05-08 18:40 1142次阅读
    <b class='flag-5'>RZ</b>/<b class='flag-5'>V</b>2N中档嵌入式<b class='flag-5'>AI</b> MPU 数据手册和产品介绍

    支持实时物体识别的视觉人工智能微处理器RZ/V2MA数据手册

    。此外,利用了 DRP技术高灵活性特点的 OpenCV 加速,除了可进行人工智能推理的图像预处理之外,还能在单芯片上实现人工智能范畴之外的高速图像处理。 *附件:支持实时物体识别的视
    的头像 发表于 03-18 18:12 737次阅读
    支持实时物体识别的视觉人工智能<b class='flag-5'>微处理器</b><b class='flag-5'>RZ</b>/<b class='flag-5'>V</b>2MA数据手册

    15TOPS、双摄像头、高能效 四核视觉AI MPU RZ/V2N数据手册

    RZ/V2N是一款视觉 AI 微处理器 (MPU),配备瑞萨电子专有的 AI 加速 (DRP-
    的头像 发表于 03-18 17:48 890次阅读
    15TOPS、双摄像头、高能效 四核视觉<b class='flag-5'>AI</b> MPU <b class='flag-5'>RZ</b>/<b class='flag-5'>V</b>2N数据手册

    AI MPU# 瑞萨RZ/V2H 四核视觉 ,采用 DRP-AI3 加速和高性能实时处理器

    RZ/V2H 高端 AI MPU 采用瑞萨电子专有的AI 加速-动态可重配置处理器 (DRP-
    的头像 发表于 03-15 11:50 1925次阅读
    <b class='flag-5'>AI</b> MPU# 瑞萨<b class='flag-5'>RZ</b>/<b class='flag-5'>V</b>2H 四核视觉 ,采用 DRP-<b class='flag-5'>AI</b>3 加速<b class='flag-5'>器</b>和高性能实时<b class='flag-5'>处理器</b>

    3D图形和视频编解码引擎的通用微处理器RZ/V2L数据手册

    引擎的通用微处理器RZ V2L数据手册.pdf DRP-AI 的卓越功率效率使其无需采取散热措施(如散热或冷却风扇)。 人工智能不仅可以在
    的头像 发表于 03-14 16:50 860次阅读
    3D图形和视频编解码<b class='flag-5'>器</b>引擎的通用<b class='flag-5'>微处理器</b><b class='flag-5'>RZ</b>/<b class='flag-5'>V</b>2L数据手册

    实现工业设备实时控制和联网的微处理器RZ/T1数据手册

    RZ/T1 处理器采用带 FPU 内核的 Arm® Cortex®-R4 处理器,专为实时处理设计,能以高达 600MHz 的频率高速运行。此外,无需通过高速缓冲存储
    的头像 发表于 03-13 17:53 829次阅读
    实现工业设备实时控制和联网的<b class='flag-5'>微处理器</b><b class='flag-5'>RZ</b>/T1数据手册

    支持低功耗模式和 PCI Express的通用微处理器RZ/G3S数据手册

    RZ/G3S 微处理器包括 Arm® Cortex®-A55 (1.1 GHz) CPU、16 位 LPDDR4 或 DDR4 接口和低功耗模式。此外,这款微处理器还配备大量接口(如 PCIe
    的头像 发表于 03-13 14:21 805次阅读
    支持低功耗模式和 PCI Express的通用<b class='flag-5'>微处理器</b><b class='flag-5'>RZ</b>/G3S数据手册

    配备RISC-V CPU内核和2个千兆以太网接口的通用微处理器RZ/Five数据手册

    RZ/Five 微处理器包括 RISC-V CPU 内核 (AX45MP Single) 1.0 GHz,16 位 DDR3L/DDR4 接口。此外,这款微处理器还配备有大量接口,如
    的头像 发表于 03-11 17:24 722次阅读
    配备RISC-<b class='flag-5'>V</b> CPU内核和2个千兆以太网接口的通用<b class='flag-5'>微处理器</b><b class='flag-5'>RZ</b>/Five数据手册

    基于嵌入式人工智能的高速图像处理微处理器RZ/A2M数据手册

    RZ/A2M MPU设计用于需要高速e-AI图像处理的智能电器,网络摄像机,服务机器人,扫描仪产品和工业机械。它采用独特的图像识别和机器视觉混合方法,结合了专有的DRP技术,对图像数据进行
    的头像 发表于 03-11 15:54 840次阅读
    基于嵌入式人工智能的高速图像<b class='flag-5'>处理</b>的<b class='flag-5'>微处理器</b><b class='flag-5'>RZ</b>/A2M数据手册

    瑞萨推出集成DRP-AI加速RZ/V2N,扩展中端AI处理器阵容,助力未来智能工厂与智慧城市发展

    2025 3 月 11 日,中国北京讯 - 全球半导体解决方案供应商瑞萨电子(TSE:6723)今日宣布推出一款面向大规模视觉AI市场的新产品——RZ/V2N,进一步扩展RZ/
    的头像 发表于 03-11 15:05 1037次阅读
    瑞萨推出集成DRP-<b class='flag-5'>AI</b>加速<b class='flag-5'>器</b>的<b class='flag-5'>RZ</b>/<b class='flag-5'>V</b>2N,扩展中端<b class='flag-5'>AI</b><b class='flag-5'>处理器</b>阵容,助力未来智能工厂与智慧城市发展

    带双通道千兆以太网RZ/G2UL通用型微处理器数据手册

    RZ/G2UL 微处理器配备一个 Cortex-A55®(1.0GHz)CPU、一个 16 位 DDR3L/DDR4 接口和一个简易的 LCD控制。 这款微处理器还配备有许多接口,例
    的头像 发表于 03-10 17:36 860次阅读
    带双通道千兆以太网<b class='flag-5'>RZ</b>/G2UL通用型<b class='flag-5'>微处理器</b>数据手册

    带片内RAM 3MB RZ/A1L RTOS微处理器数据手册

    RZ/A1L 系列微处理器(MPU)采用了运行频率达 400MHz 的 Arm® Cortex® - A9 内核,并配备 3MB的片上静态随机存取存储(SRAM)。凭借这 3MB 的片上 SRAM
    的头像 发表于 03-10 16:14 885次阅读
    带片内RAM 3MB <b class='flag-5'>RZ</b>/A1L RTOS<b class='flag-5'>微处理器</b>数据手册