0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

当深度学习遇上TDA4

星星科技指导员 来源:TI 作者:Fredy Zhang;Kangjia 2023-03-15 10:09 次阅读

深度学习机器学习的一个子集,常用于自然语言处理,计算机视觉等领域,与众不同之处在于,DL(Deep Learning )算法可以自动从图像、视频或文本等数据中学习数据特征。DL可以直接从数据中学习,这比较类似于人脑的运行方式,获得更多数据后,准确度也会越来越高。TIDL(TI Deep Learning Library) 是TI平台基于深度学习算法的软件生态系统,可以将一些常见的深度学习算法模型快速的部署到TI嵌入式平台。 TDA4拥有TI最新一代的深度学习加速模块C7x DSP与MMA矩阵乘法加速器,可以运行TIDL进行卷积等基本计算,从而快速地进行前向推理,得到计算结果。 当深度学习遇上TDA4,你的模型部署流程将变得简单,你的模型将高效地运行在TDA4上。

TI 最新一代的汽车处理器TDA4VM集成了高性能计算单元C7x DSP(Digital Signal Processor)和Deep-learning Matrix Multiply Accelerator(MMA),可以高效地进行卷积计算、矩阵变换等一些基本地深度学习算子。TIDL 是TI的针对于嵌入式平台部署深度学习不方便,计算效率低下而设计的一个软件生态系统,用于加速 TI 嵌入式设备上的深度神经网络Deep Neural Networks (DNN)计算加速。 上一代产品 TDA2/3 系列处理器,集成了计算单元 DSP(Digital Signal Processor)和 EVE(Embedded Vision/Vector Engine),用于加速计算深度学习神经网络。相比于上一代TDA2/TDA3系列处理器,最新一代的TDA4处理器在算例上得到了大幅提高的同时,在软件方面提供了更好地支持,同时提供了更多的深度学习模型的部署示例,方便开发人员快速开发迭代产品,极大地缩短的产品开发周期。

pYYBAGQRKMqAH9FhAAFvNQDUgPE901.png

图1. TIDL SW Framework

基于深度神经网络 (DNN) 的机器学习算法用于许多行业,例如机器人工业和汽车。越来越多的基于 DNN 的机器学习算法被应用于 ADAS 产品中,如车道线检测,交通信号灯识别,行人识别等ADAS基础功能均采用DNN算法实现。这些DNN神经网络算法通常需要大量的计算,而TI TDA4系列处理器中的C7x和MMA可以将一些DNN中的算子进行加速计算,以实现快速推理得到识别结果。RTOS SDK 中集成了众多的Demo展示TIDL在TDA4处理器上对实时的语义分割和 SSD 目标检测的能力。如下图2:AVP的demo展示了使用TIDL对泊车点、车辆的检测。

pYYBAGQRKMuAeg4sAAEMaFGB14E810.png

图2. TIDL SW Framework

TIDL当前支持的训练框架有Tensorflow、Pytorch、Caffe等,用户可以根据需要选择合适的训练框架进行模型训练。TIDL可以将PC端训练好的模型导入编译生成TIDL可以识别的模型格式,同时在导入编译过程中进行层级合并以及量化等操作,方便导入编译后的模型高效的运行在具有高性能定点数据感知能力TDA4硬件加速器上。 TIDL提供了一些的工具,如模型导入工具,模型可视化工具等,非常便捷地可以对训练好地模型进行导入。

poYBAGQRKMyADFmTAABsREPFg54349.png

图3. TIDL Tools

TIDL Runtime 是运行在TDA4端的实时推理单元,同时提供了TIDL的运行环境,对于input tensor,TIDL TIOVX Node 调用TIDL 的深度学习加速库进行感知,并将结果进行输出。

pYYBAGQRKM2AJiObAABamsWM3iI992.png

图4. TIDL Runtime

如图5所示,是TIDL的软件框架。在TIDL上,深度学习网络应用开发主要分为三个大的步骤(以TI Jacinto7TM TDA4VM处理器为例):

pYYBAGQRKM6AbMypAABOgWqM8K8253.png

图5. TIDL SW Framework

基于Tensorflow、Pytorch、Caffe 等训练框架,训练模型:选择一个训练框架,然后定义模型,最后使用相应的数据集训练出满足需求的模型。

基于TI Jacinto7TM TDA4VM处理器导入模型: 训练好的模型,需要使用TIDL Importer工具导入成可在TIDL上运行的模型。导入的主要目的是对输入的模型进行量化、优化并保存为TIDL能够识别的网络模型和网络参数文件。

基于TI Jacinto7TM SDK 验证模型,并在应用里面部署模型:

PC 上验证并部署

在PC上使用TIDL推理引擎进行模型测试。

在PC上使用OpenVX框架开发程序,在应用上进行验证。

EVM上验证并部署

在EVM上使用TIDL推理引擎进行模型测试。

在EVM上使用OpenVX框架开发程序,在应用上进行验证

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    4983

    文章

    18286

    浏览量

    288494
  • 计算机
    +关注

    关注

    19

    文章

    6651

    浏览量

    84556
  • 深度学习
    +关注

    关注

    73

    文章

    5239

    浏览量

    119912
收藏 人收藏

    评论

    相关推荐

    spark和深度学习的基本原理

    Spark遇上TensorFlow分布式深度学习框架原理和实践
    发表于 09-09 08:46

    深度学习DeepLearning实战

    一:深度学习DeepLearning实战时间地点:1 月 15日— 1 月18 日二:深度强化学习核心技术实战时间地点: 1 月 27 日— 1 月30 日(第一天报到 授课三天;提前
    发表于 01-09 17:01

    AI遇上FPGA会产生怎样的反应

    是人工智能大跃进的基础,在线下模型训练中Xeon-Phi、GPU等发挥着巨大的作用,而在线上的推理任务中,浪潮FPGA深度学习加速解决方案则能够实现7倍以上的能效比提升。 卷积网络之父、Facebook
    发表于 09-17 17:08

    恩智浦S32V/英伟达DRIVE PX2/TI的TDA4/寒武纪1M/高通SA8155对比分析哪个好?

    恩智浦S32V/英伟达DRIVE PX2/TI的TDA4/寒武纪1M/高通SA8155对比分析哪个好?
    发表于 09-30 07:03

    基于深度神经网络的激光雷达物体识别系统

    的激光雷达物体识别技术一直难以在嵌入式平台上实时运行。经纬恒润经过潜心研发,攻克了深度神经网络在嵌入式平台部署所面临的算子定制与加速、量化策略、模型压缩等难题,率先实现了高性能激光检测神经网络并成功地在嵌入式平台(德州仪TI TDA4系列)上完成部署。系统功能目前该系统:
    发表于 12-21 07:59

    基于双TDA4VM行泊一体方案

    ,我们也看到了智能驾驶技术的提升和巨大的想象空间。 基于双TDA4VM行泊一体方案已经量产。同时,伴随着算法软件成熟度的提高、更高性能芯片的出现,以及系统成本优势,使得单芯片TDA4行泊一体化的方案成为
    发表于 11-03 07:54

    TDA4深度学习的重要性

    快速的部署到TI嵌入式平台。 TDA4拥有TI最新一代的深度学习加速模块C7x DSP与MMA矩阵乘法加速器,可以运行TIDL进行卷积等基本计算,从而快速地进行前向推理,得到计算结果。
    发表于 11-03 06:53

    超异构芯片TDA4内核解析

    1、超异构芯片TDA4内核解析超异构芯片最近是比较火的一个名词,其集中特性是将各类不同的芯片内核进行融合,这种集成式芯片设计可以充分整合芯片资源,进一步提升数据计算效率。并且由于芯片在设计之初就打
    发表于 12-09 16:29

    什么是深度学习?使用FPGA进行深度学习的好处?

    ,即使使用具有一定低位宽的数据,深度学习推理也不会降低最终精度。目前据说8位左右可以提供稳定的准确率,但最新的研究表明,已经出现了即使降低到4位或2位也能获得很好准确率的模型和学习方法
    发表于 02-17 16:56

    基于深度学习算法的软件生态系统

    模型快速的部署到TI嵌入式平台。 TDA4拥有TI最新一代的深度学习加速模块C7x DSP与MMA矩阵乘法加速器,可以运行TIDL进行卷积等基本计算,从而快速地进行前向推理,得到计算结果。 当
    的头像 发表于 06-30 17:01 1794次阅读
    基于<b class='flag-5'>深度</b><b class='flag-5'>学习</b>算法的软件生态系统

    TDA4行泊一体,打开智能驾驶的新篇章

    TDA4行泊一体,打开智能驾驶的新篇章
    发表于 10-28 11:59 13次下载
    单<b class='flag-5'>TDA4</b>行泊一体,打开智能驾驶的新篇章

    深度学习遇上TDA4

    深度学习遇上TDA4
    发表于 10-28 11:59 2次下载
    当<b class='flag-5'>深度</b><b class='flag-5'>学习</b><b class='flag-5'>遇上</b><b class='flag-5'>TDA4</b>

    TDA4动态热检测与控制方案

    TDA4动态热检测与控制方案
    发表于 10-28 11:59 1次下载
    <b class='flag-5'>TDA4</b>动态热检测与控制方案

    德州仪器TDA4背后的OpenVX介绍

    近年来行泊一体大行其道,德州仪器的TDA4占了行泊一体大约70%的市场。其背后关键的就是OpenVX。
    的头像 发表于 02-16 09:18 6237次阅读

    TDA4 SPL SBL启动流程简析

    TDA4是TI推出的一款高性能、超异构的多核SoC,拥有ARM Cortex-R5F、ARM Cortex-A72、C66以及C71内核,可以部署AUTOSAR CP系统、HLOS(Linux
    的头像 发表于 10-24 16:37 994次阅读
    <b class='flag-5'>TDA4</b> SPL SBL启动流程简析