0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

工程师说 | R-Car DNN模拟器的介绍 (2)

瑞萨电子 来源:未知 2023-07-13 18:15 次阅读

摘要

瑞萨提供的R-Car SoC相关的一些DNN模拟器中,本文将重点介绍能够实现与实际硬件等价运算的Accurate Simulator,并说明如何应用它来分析和提高神经网络的精度。

太田 寛史

Principal Software Engineer

9eabd0e6-2165-11ee-962d-dac502259ad0.png

背景

R-Car SoC是我们提出的一种高性能、低功耗的SoC。为了在R-Car SoC上运行客户用主流深度学习框架(如PyTorch、TensorFlow等)训练的模型,需要采用剪枝(*1)和量化(*2)等非等效的近似方法进行模型压缩。我们提供的R-Car CNN工具,不仅可以在R-Car SoC上执行上述近似程序,运行客户训练好的深度学习模型,还可以根据客户的应用场景提供不同精度和速度的模拟器。这样即使您没有R-Car SoC硬件,也可以验证操作和进行性能预估。(*3)

在各类模拟器中,Accurate Simulator能获得与实际R-Car SoC最为一致的输出结果。本文提出使用Accurate Simulator对模型进行调试分析和精度改进的方法。通过逐步追踪在实际的R-Car SoC中无法确认的模型的中间输出,我们将介绍确定意外结果产生原因并提高准确性的方法。

9eabd0e6-2165-11ee-962d-dac502259ad0.png

使用场景

为了将客户训练好的深度学习模型转换成可以在R-Car SoC上执行的格式,需要进行非等价的近似模型压缩,如剪枝和量化。量化是一种将为浮点运算的模型近似为整数运算模型的方法。在这个过程中,每层输出张量的最大值和最小值由多个输入图像估计,每层权重参数的最大值和最小值,以及量化参数(scaleとzero point)将被确定(校准)。当在实际的R-Car SoC或模拟器(*4)上验证这个量化模型时,与原始训练模型的结果相比,不同的输入图像数据可能会导致意想不到的结果。在这种情况下,使用Accurate Simulator来分析模型是非常有用的,它可以直接观察模型中的中间输出,而这些输出在实际的R-Car SoC上无法获取。

9eabd0e6-2165-11ee-962d-dac502259ad0.png

使用Accurate Simulator

进行模型分析的流程

在上述案例中,校准时输入图像数据的质量或数量不足,可能导致(a)校准不理想或(b)中间输出波动较大的层所导致的量化失败。在这种情况下,首先确定原因是(a)还是(b),然后采取(a)增加或更新输入图像数据并再次进行校准,或(b)确定发生问题的层并增加该层的位宽以提高量化模型的准确性等有效方法。

Accurate Simulator是一个模拟器,旨在确保输出结果与实际的R-Car SoC机器完全匹配。与R-Car SoC不同,Accurate Simulator允许用户提取模型中每一层的中间输出。具体来说,用户可以用Accurate Simulator从输入图像数据的层侧开始逐一提取各层的中间输出,并与原始训练模型的中间输出相比较以确认误差。

9eabd0e6-2165-11ee-962d-dac502259ad0.png

演示示例

当使用我们的R-Car SoC时,客户使用我们的R-Car CNN工具将训练好的模型转换为R-Car SoC的执行格式并执行。以下假设在原始训练模型(例如TensorFlow)和R-Car SoC的输出结果在运行时不匹配的情况下找出原因并解决的方法。我们将说明如何使用Accurate Simulator直接比较原始TensorFlow模型和R-Car可执行格式模型的中间输出来估计量化误差。

1

将客户训练好的TensorFlow模型转换为ONNX,并使用我们的R-Car CNN工具将其转换为Accurate Simulator可执行的格式,同时提供量化条件和足够数量的图像数据用于校准。

2

运行客户的TensorFlow模型,提取要比较的层的中间输出。

3

使用R-Car SDK runtime,运行①中生成的Accurate Simulator的执行格式模型。需要比较的层的中间输出可以在这个步骤被提取出来。

4

比较在②和③中得到的中间输出的组成部分。Accurate Simulator的输出结果是在模型量化的前提下以整数表示的,我们也准备了反量化的工具。图中的图表显示了由TensorFlow和Accurate Simulator生成的中间输出张量成分的直接比较。在这个例子中,比较结果几乎是相同的,这一层没有任何问题。

5

重复步骤①到④,以确定近似被破坏的那一层。通过增加相关层的量化参数的显示位宽(如从8位到16位)可以提高量化模型的输出结果精度。

wKgZomSzwAOAZtHdAAJ8XQrG-RE122.png

图1:TensorFlow和Accurate Simulator之间的中间输出比较流程

9eabd0e6-2165-11ee-962d-dac502259ad0.png

总结

本文介绍了一种方法,当客户训练的模型在我们的R-Car SoC上运行,其输出结果不尽如人意的时候,可以使用Accurate Simulator找出原因并提高模型的精度。Accurate Simulator的设计是为了获得与实际R-Car SoC相当的计算结果,可用于调查无法使用实际设备检查的模型的中间输出。我们希望客户能利用这一点进行模型的调试评估,提高模型的精度。今后,瑞萨将继续致力于R-Car CNN工具的开发,供客户用于模型评估和验证。

备注

(*1)对识别结果贡献小的权重被设置为零,这些权重的计算被跳过,从而减少计算量和内存的使用。

(*2)推理过程中浮点计算通常被转换为近似(如8bit)的整数运算。这里的量化被称为PTQ(post training quantization),它通过使用多个输入图像进行校准来优化量化参数(scale & zero point)。

(*3)点击查看往期文章:R-Car DNN模拟器的介绍

(*4)除了Accurate Simulator外,瑞萨还提供指令集模拟器(ISS),其目的是实现与实际硬件相当的计算精度。不仅如此,ISS还模拟实际硬件的计算过程本身,使用户能够在非常接近实际硬件的环境下测试模型。

1

END

1

瑞萨电子 (TSE: 6723)

科技让生活更轻松,致力于打造更安全、更智能、可持续发展的未来。作为全球微控制器供应商,瑞萨电子融合了在嵌入式处理、模拟、电源及连接方面的专业知识,提供完整的半导体解决方案。成功产品组合加速汽车、工业、基础设施及物联网应用上市,赋能数十亿联网智能设备改善人们的工作和生活方式。更多信息,敬请访问renesas.com


原文标题:工程师说 | R-Car DNN模拟器的介绍 (2)

文章出处:【微信公众号:瑞萨电子】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 瑞萨
    +关注

    关注

    32

    文章

    22214

    浏览量

    84915

原文标题:工程师说 | R-Car DNN模拟器的介绍 (2)

文章出处:【微信号:瑞萨电子,微信公众号:瑞萨电子】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    大咖说 | 瑞萨第5代R-Car产品家族,为汽车OEM带来可扩展MCU/SoC解决方案

    本篇将为您介绍瑞萨R-Car Gen5产品家族。 Vivek Bhan Senior Vice President, Co-General Manager of High Performance
    的头像 发表于 12-21 18:15 365次阅读
    大咖说 | 瑞萨第5代<b class='flag-5'>R-Car</b>产品家族,为汽车OEM带来可扩展MCU/SoC解决方案

    工程师说 | RX系列软件的历史和今后的展望 #6

    的历史和今后的展望 #4 工程师说 | RX系列软件的历史和今后的展望 #5 本篇将为大家介绍如何在RX产品家族典型的100MHz级MCU中搭载网络软件。 Hiroki Ishiguro Sr
    的头像 发表于 11-16 18:15 320次阅读
    <b class='flag-5'>工程师说</b> | RX系列软件的历史和今后的展望 #6

    鸿蒙原生应用开发-DevEco Studio远程模拟器的使用

    重新申请资源。具体步骤如下: 1.需要登录华为开发者联盟账户 2.登录过程 查看和使用模拟器资源 在Single Device中,单击设备运行按钮,启动远程模拟设备(同一时间只能启动一个设备)。 单击
    发表于 11-10 17:01

    什么是光伏模拟器?光伏模拟器能做什么?

    什么是光伏模拟器?光伏模拟器能做什么? 光伏模拟器是一种用来模拟太阳能光伏电池的工作原理和性能的软硬件设备。它可以提供光伏电池在不同光照、温度和环境条件下的电流、电压、功率等参数。光伏
    的头像 发表于 11-10 15:57 758次阅读

    鸿蒙原生应用开发-DevEco Studio超级终端模拟器的使用

    Studio会启动应用/服务的编译构建,完成后应用/服务即可运行在超级终端模拟器上。当前DevEco Studio提供了具备跨设备特性的工程模板,可以使用“Video Player Ability
    发表于 11-08 15:09

    鸿蒙原生应用开发-DevEco Studio本地模拟器的使用

    设备的System-image。 升级模拟器版本时,需同时勾选Platforms下的System-image和Tools下的Emulator资源,勾选后点击Apply。 图1 下载System-image资源 图2
    发表于 11-07 14:21

    新品发布 | 瑞萨电子推出R-Car S4入门套件,实现汽车网关系统的快速软件开发

    (SoC)的软件开发,该SoC为云通信和安全车辆控制提供高计算性能和一系列通信功能。与现有 R-Car S4参考板 相比,新的入门套件是一个成本更低且易用的选择,构建了包含评估板和软件的完整开发环境。工程师可以利用全新套件轻松开始对汽车服务器、互联网关、连接模
    的头像 发表于 07-13 18:15 437次阅读
    新品发布 | 瑞萨电子推出<b class='flag-5'>R-Car</b> S4入门套件,实现汽车网关系统的快速软件开发

    瑞萨电子推出R-Car S4入门套件 实现汽车网关系统的快速软件开发

    R-Car S4入门套件包括基本的R-Car S4接口,如以太网TSN交换机和CAN FD,以及4GB(千兆字节)LPDDR4、128GB UFS(通用闪存)和64MB(兆字节)Quad SPI闪存等存储器。另外,用户可以通过使用扩展连接器轻松扩展外设功能,并根据个别需求
    的头像 发表于 07-13 09:59 422次阅读

    R-Car E2用户手册: 硬件

    R-Car E2 用户手册: 硬件
    发表于 07-11 19:28 0次下载
    <b class='flag-5'>R-Car</b> E2用户手册: 硬件

    R-Car V3M Starter Kit 原理图s

    R-Car V3M Starter Kit 原理图s
    发表于 07-10 18:43 1次下载
    <b class='flag-5'>R-Car</b> V3M Starter Kit 原理图s

    R-Car V3M 入门套件硬件手册

    R-Car V3M 入门套件硬件手册
    发表于 07-07 18:42 0次下载
    <b class='flag-5'>R-Car</b> V3M 入门套件硬件手册

    R-Car V3M 入门套件硬件手册

    R-Car V3M 入门套件硬件手册
    发表于 07-06 19:25 0次下载
    <b class='flag-5'>R-Car</b> V3M 入门套件硬件手册

    R-Car CAN扩展板用户手册

    R-Car CAN扩展板用户手册
    发表于 07-03 20:35 0次下载
    <b class='flag-5'>R-Car</b> CAN扩展板用户手册

    Wokwi Arduino模拟器介绍

    电子发烧友网站提供《Wokwi Arduino模拟器介绍.zip》资料免费下载
    发表于 06-27 11:42 4次下载
    Wokwi Arduino<b class='flag-5'>模拟器</b><b class='flag-5'>介绍</b>

    快速选择合适的GNSS模拟器,看这几个重点!

    您是否还在为选择哪款GNSS模拟器而烦恼呢?面对多种多样的GNSS模拟器,选用合适的模拟器来进行测试是非常重要的,本期文章为您介绍了如何选择能够满足特定测试要求的GNSS
    的头像 发表于 06-19 09:57 620次阅读
    快速选择合适的GNSS<b class='flag-5'>模拟器</b>,看这几个重点!