0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于深度学习算法的软件生态系统

电子设计 来源:电子设计 作者:电子设计 2022-06-30 17:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

深度学习机器学习的一个子集,常用于自然语言处理,计算机视觉等领域,与众不同之处在于,DL(Deep Learning )算法可以自动从图像、视频或文本等数据中学习数据特征。DL可以直接从数据中学习,这比较类似于人脑的运行方式,获得更多数据后,准确度也会越来越高。TIDL(TI Deep Learning Library) 是TI平台基于深度学习算法的软件生态系统,可以将一些常见的深度学习算法模型快速的部署到TI嵌入式平台。 TDA4拥有TI最新一代的深度学习加速模块C7x DSP与MMA矩阵乘法加速器,可以运行TIDL进行卷积等基本计算,从而快速地进行前向推理,得到计算结果。 当深度学习遇上TDA4,你的模型部署流程将变得简单,你的模型将高效地运行在TDA4上。

TI 最新一代的汽车处理器TDA4VM集成了高性能计算单元C7x DSP(Digital Signal Processor)和Deep-learning Matrix Multiply Accelerator(MMA),可以高效地进行卷积计算、矩阵变换等一些基本地深度学习算子。TIDL 是TI的针对于嵌入式平台部署深度学习不方便,计算效率低下而设计的一个软件生态系统,用于加速 TI 嵌入式设备上的深度神经网络Deep Neural Networks (DNN)计算加速。 上一代产品 TDA2/3 系列处理器,集成了计算单元 DSP(Digital Signal Processor)和 EVE(Embedded Vision/Vector Engine),用于加速计算深度学习神经网络。相比于上一代TDA2/TDA3系列处理器,最新一代的TDA4处理器在算例上得到了大幅提高的同时,在软件方面提供了更好地支持,同时提供了更多的深度学习模型的部署示例,方便开发人员快速开发迭代产品,极大地缩短的产品开发周期。

poYBAGK9VZSAcnsOAAFvNQDUgPE036.png

图1. TIDL SW Framework

基于深度神经网络 (DNN) 的机器学习算法用于许多行业,例如机器人、工业和汽车。越来越多的基于 DNN 的机器学习算法被应用于 ADAS 产品中,如车道线检测,交通信号灯识别,行人识别等ADAS基础功能均采用DNN算法实现。这些DNN神经网络算法通常需要大量的计算,而TI TDA4系列处理器中的C7x和MMA可以将一些DNN中的算子进行加速计算,以实现快速推理得到识别结果。RTOS SDK 中集成了众多的Demo展示TIDL在TDA4处理器上对实时的语义分割和 SSD 目标检测的能力。如下图2:AVP的demo展示了使用TIDL对泊车点、车辆的检测。

pYYBAGK9VZaAO499AAEMaFGB14E850.png

图2. TIDL SW Framework

TIDL当前支持的训练框架有Tensorflow、Pytorch、Caffe等,用户可以根据需要选择合适的训练框架进行模型训练。TIDL可以将PC端训练好的模型导入编译生成TIDL可以识别的模型格式,同时在导入编译过程中进行层级合并以及量化等操作,方便导入编译后的模型高效的运行在具有高性能定点数据感知能力TDA4硬件加速器上。 TIDL提供了一些的工具,如模型导入工具,模型可视化工具等,非常便捷地可以对训练好地模型进行导入。

poYBAGK9VZiAL3e_AABsREPFg54949.png

图3. TIDL Tools

TIDL Runtime 是运行在TDA4端的实时推理单元,同时提供了TIDL的运行环境,对于input tensor,TIDL TIOVX Node 调用TIDL 的深度学习加速库进行感知,并将结果进行输出。

pYYBAGK9VZuAU7vZAABamsWM3iI606.png

图4. TIDL Runtime

如图5所示,是TIDL的软件框架。在TIDL上,深度学习网络应用开发主要分为三个大的步骤(以TI Jacinto7TM TDA4VM处理器为例):

poYBAGK9VZ2ALBrEAABOgWqM8K8107.png

图5. TIDL SW Framework

基于Tensorflow、Pytorch、Caffe 等训练框架,训练模型:选择一个训练框架,然后定义模型,最后使用相应的数据集训练出满足需求的模型。

基于TI Jacinto7TM TDA4VM处理器导入模型: 训练好的模型,需要使用TIDL Importer工具导入成可在TIDL上运行的模型。导入的主要目的是对输入的模型进行量化、优化并保存为TIDL能够识别的网络模型和网络参数文件。

基于TI Jacinto7TM SDK 验证模型,并在应用里面部署模型:

PC 上验证并部署

在PC上使用TIDL推理引擎进行模型测试。

在PC上使用OpenVX框架开发程序,在应用上进行验证。

EVM上验证并部署

在EVM上使用TIDL推理引擎进行模型测试。

在EVM上使用OpenVX框架开发程序,在应用上进行验证

当深度学习遇上TDA4,模型部署变得简单的同时,模型也可以更加高效地运行。让我们开启TDA4的探索之旅,你的AI旅程将变得轻松愉快。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20329

    浏览量

    254834
  • ti
    ti
    +关注

    关注

    114

    文章

    8084

    浏览量

    219997
  • 深度学习
    +关注

    关注

    73

    文章

    5604

    浏览量

    124615
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    爱立信携手苹果和联发科技加速构建6G生态系统

    爱立信正通过与苹果和联发科技等领先设备及芯片制造商建立战略合作伙伴关系,加速构建6G生态系统,驱动下一代连接技术的创新与互操作性,助力运营商及整个产业为移动网络的未来做好准备。
    的头像 发表于 03-03 10:09 3370次阅读

    米尔RK3576成功上车!ROS2 Humble生态系统体验

    Humble生态系统,完美移植到了这颗国产芯片上。一个稳定、全功能的机器人软件开发平台已经就绪,现在就来一起探索它的强大魅力! 一、系统启动与基础性能展示1. 硬件平台简介 开发板:MYD-LR3576
    发表于 01-15 18:30

    探索HD3SS460:USB Type-C生态系统的高性能复用解决方案

    探索HD3SS460:USB Type-C生态系统的高性能复用解决方案 在当今的电子设备领域,USB Type-C接口凭借其强大的功能和便捷性,成为了众多设备的标配。而HD3SS460作为一款专门为
    的头像 发表于 01-14 09:55 999次阅读

    Ceva 添加 Sensory 的 TrulyHandsfree 语音激活功能, 增强 NeuPro-Nano NPU 生态系统

    体验的需求激增,Ceva公司(纳斯达克股票代码:CEVA)扩展其针对NeuPro-Nano NPU的广泛人工智能生态系统,以满足这一需求。今天,Ceva和Sensory公司宣布合作,将Sensory
    的头像 发表于 01-09 11:22 685次阅读
    Ceva 添加 Sensory 的 TrulyHandsfree 语音激活功能, 增强 NeuPro-Nano NPU <b class='flag-5'>生态系统</b>

    Cadence推出全新完整小芯片生态系统

    楷登电子(美国 Cadence 公司,NASDAQ:CDNS)今日宣布推出从设计规范到封装部件的完整小芯片生态系统,助力客户开发面向物理 AI、数据中心及高性能计算 (HPC) 应用的小芯片,旨在降低工程设计复杂度,缩短产品上市周期。
    的头像 发表于 01-08 16:53 1020次阅读
    Cadence推出全新完整小芯片<b class='flag-5'>生态系统</b>

    HD3SS460:USB Type - C 生态系统的多功能复用解决方案

    HD3SS460:USB Type - C 生态系统的多功能复用解决方案 在当今高速发展的电子科技领域,USB Type - C 接口凭借其强大的功能和便捷性,成为了众多设备的首选。而
    的头像 发表于 12-22 15:15 1264次阅读

    人工智能AI必备的5款开源软件推荐!

    开发领域里几乎“人手必备”的软件——它们不仅让学习更轻松,也让产品更快落地。 一、TensorFlow:深度学习界的“老将” 提起智能算法
    的头像 发表于 11-19 15:35 853次阅读
    人工智能AI必备的5款开源<b class='flag-5'>软件</b>推荐!

    威宏科技加入Arm Total Design生态系统,携手推动AI与HPC芯片创新

    2025 年 10 月 15 日 – 系统级IC设计服务领导厂商威宏科技(VIA NEXT)今日宣布正式加入 Arm® Total Design生态系统。此合作展现了威宏科技致力于提供创新
    的头像 发表于 10-16 14:04 539次阅读
    威宏科技加入Arm Total Design<b class='flag-5'>生态系统</b>,携手推动AI与HPC芯片创新

    BPI-AIM7 RK3588 AI与 Nvidia Jetson Nano 生态系统兼容的低功耗 AI 模块

    应用。 []() AIM-IO是一款专为 Jetson Nano 生态系统设计的开源扩展板。它与 RK3588 AI Module7 配合使用,为您提供一个微型 AI 开发平台,支持定制载板开发,并加速机器
    发表于 10-11 09:08

    BPI-AIM7 RK3588 AI与 Nvidia Jetson Nano 生态系统兼容的低功耗 AI 模块

    应用。 AIM-IO 是一款专为 Jetson Nano 生态系统设计的开源扩展板。它与 RK3588 AI Module7 配合使用,为您提供一个微型 AI 开发平台,支持定制载板开发,并加速机器学习在智能
    的头像 发表于 10-11 09:06 1412次阅读
    BPI-AIM7 RK3588 AI与 Nvidia Jetson Nano <b class='flag-5'>生态系统</b>兼容的低功耗 AI 模块

    边缘感知生态系统

    智能系统 创建边缘智能传感器系统的三种主流方法,如图 1 所示。“经典方法”非常灵活,具有在主机 MCU 上运行的完整算法。 在传感器中集成机器学习和数字信号处理功能,代表着向“真正的
    的头像 发表于 10-01 15:16 2076次阅读
    边缘感知<b class='flag-5'>生态系统</b>

    RISC-V 在数据中心软件生态系统中的机遇与挑战

    软件适配来看,数据中心核心业务涉及的操作系统、存储、数据库、大数据平台、云虚拟化技术及主流编程语言运行时等,大多已能在 RISC-V 架构服务器上实现基础运行。   2025 年 7 月 18 日,在第五届(2025)RISC-V 中国峰会的
    发表于 07-18 13:38 5521次阅读

    OpenGMSL™联盟成立 将SerDes传输打造成为全球汽车生态系统的开放标准

    与测量方面的专业知识,为车载连接标准化、开放式生态系统的发展提供支持。”——Rohde Schwarz, Rosenberger Gr
    的头像 发表于 06-04 09:18 2707次阅读
    OpenGMSL™联盟成立 将SerDes传输打造成为全球汽车<b class='flag-5'>生态系统</b>的开放标准

    地物光谱仪在多维生态系统监测中的应用

    在气候变化与生物多样性快速演变的背景下,生态系统的监测与研究正走向精细化、数据化和智能化。越来越多科研人员将一种名为“地物光谱仪”的设备,视为构建生态研究“数据引擎”的关键组件。 那么,什么是地物
    的头像 发表于 05-16 17:43 724次阅读
    地物光谱仪在多维<b class='flag-5'>生态系统</b>监测中的应用

    如何借助大语言模型打造人工智能生态系统

    、硬件需求以及所涉及的财务影响这三者之间的内在联系。我们将深入探究现实中大语言模型的发展趋势,并共同探讨如何借助规模更小、效能更高的模型,打造一个更具可持续性的人工智能生态系统
    的头像 发表于 04-27 09:19 1222次阅读
    如何借助大语言模型打造人工智能<b class='flag-5'>生态系统</b>