0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于深度学习推理的高性能工具包

星星科技指导员 来源:嵌入式计算设计 作者:Saumitra Jagdale 2022-08-16 11:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近年来,深度神经网络在将计算机视觉算法的准确性提升到一个新的水平方面取得了重大进展。OpenVINO 工具包就是这样一个示例,它可以在提供高性能的同时优化 DNN 模型。

英特尔其 OpenVINO 工具套件的最新版本 (2022.1),可为任何地方的开发人员提供更简单的部署。OpenVINO 是“Open Visual Inference and Neural Network Optimization”的缩写,是一个跨平台的深度学习工具包,可提供额外的深度学习模型、设备可移植性和更高的推理性能,代码更改更少。它专注于通过一次写入、随处部署的方法来增强深度神经网络推理,从而优化应用程序的开发生命周期。

该工具包有两个版本,一个开源 OpenVINO 工具包和一个英特尔 Distribution of OpenVINO 工具包。OpenVINO 工具包主要用于开发各种问题的快速解决方案,如模拟人类视觉、语音识别、自然语言处理、推荐系统等。它为开发人员在其 AI 界面上工作以及采用和维护提供了一种更简单的替代方案他们的代码。OpenVINO 建立在最新一代人工神经网络 (ANN) 的基础上,例如卷积神经网络 (CNN) 以及循环和基于注意力的网络。

在英特尔硬件中,OpenVINO 包含计算机视觉和非计算机视觉工作负载。通过其众多功能,它确保了最大的性能并加快了应用程序的开发。它提供了来自自己的 Open Model Zoo 的预训练模型,这些模型提供了优化的模型。OpenVINO 提供了模型优化器 API,可以转换您提供的模型并为推理做好准备。推理引擎允许用户通过编译优化的网络和管理特定设备上的推理操作来调整性能。而且由于该工具包与大多数框架兼容,因此干扰最小,性能最高。

英特尔的 OpenVINO 工具套件分发版旨在促进和简化高性能计算机视觉和深度学习推理应用程序在广泛使用的英特尔平台上的开发、创建和部署。OpenVINO 的应用范围从自动化和安全到农业、医疗保健等等。

版本 2022.1 的功能

此版本为之前的 2021.3 版本提供了错误修复和功能更改。

更新,更清洁的 API

这个新版本使维护开发人员的代码变得更加容易。它可以与最小化转换的 TensorFlow 约定集成。此版本减少了模型优化器中的 API 参数,以最大限度地降低复杂性。另一方面,在开放式神经网络交换 (ONNX*) 模型上的模型转换性能得到了显着提升。

更广泛的模型支持

用户可以在包括自然语言处理 (NLP)、双精度和计算机视觉在内的各种深度学习模型中轻松部署应用程序。以 NLP 为重点,以及额外类别的异常检测,预训练模型可用于工业检查、降噪、问答、翻译和文本到语音。

便携性和性能

此版本承诺通过跨 CPUGPU 等的自动设备发现、负载平衡和动态推理并行性来提升性能。

OpenVINO 工具包附加组件

计算机视觉注释工具

数据集管理框架

深度学习流媒体

神经网络压缩框架

OpenVINO 模型服务器

OpenVINO 安全插件

培训扩展

OpenVINO 的工作原理

pYYBAGL7DraAFN7pAADFgyCkOOQ706.png

图片来源:Viso.ai

OpenVINO 工具包由各种开发和部署工具组成,其中包括一套完全配置的预训练模型和用于评估的硬件。以下步骤描述了 OpenVINO 的工作原理:

先决条件:设置 OpenVINO

在开始实际工作流程之前,请确保您选择了主机、目标平台和模型。该工具支持 Linux、Windows、macOS 和 Raspbian 等操作系统。至于深度学习模型训练框架,它支持TensorFlow、Caffe、MXNet、Kaldi,以及开放神经网络交换(ONNX)模型格式。

第 1 步:训练模型

第一步是准备和训练深度学习模型。您可以从 Open Model Zoo 中找到预训练的模型,也可以构建自己的模型。OpenVINO 为公共模型提供经过验证的支持,并在存储库中提供一系列代码示例和演示。您可以使用脚本为用于训练模型的框架配置模型优化器。

第 2 步:转换和优化模型

配置模型后,您可以运行模型优化器将模型转换为中间表示 (IR),该中间表示 (IR) 以一对文件(.xml 和 .bin)的形式表示。除了这对文件(.xml 和 .bin)之外,模型优化器还通过输出诊断消息来帮助进一步调整。

第 3 步:调整性能

在这一步中,推理引擎用于编译优化模型。推理引擎是一种高级(C、C++Python*)推理 API,它作为每种硬件类型的动态加载插件实现。它为每个硬件提供最佳性能,无需维护多个代码路径。

第 4 步:部署应用程序

推理引擎用于部署应用程序。使用部署管理器,您可以通过将模型、IR 文件、应用程序和相关依赖项组装到目标设备的运行时包中来创建开发包。

综上所述,这个新版本的 OpenVINO 工具包提供了许多好处,不仅优化了用户部署应用程序的体验,还增强了性能参数。它使用户能够开发具有易于部署、更多深度学习模型、更多设备可移植性和更高推理性能且代码更改更少的应用程序。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    88

    文章

    11821

    浏览量

    219598
  • C++
    C++
    +关注

    关注

    22

    文章

    2131

    浏览量

    77416
  • 深度学习
    +关注

    关注

    73

    文章

    5610

    浏览量

    124652
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    KITSGTL5000EVBE 开发工具包无响应,i2c 失败的原因?

    KITSGTL5000EVBE 开发工具包无响应,i2c 失败
    发表于 04-22 07:11

    AD9231:高性能 12 位双路 ADC 的深度剖析

    AD9231:高性能 12 位双路 ADC 的深度剖析 最近在研究高性能模拟 - 数字转换器(ADC),AD9231 这款芯片引起了我的注意,下面就跟大家详细分享一下这款芯片的特点、性能
    的头像 发表于 04-01 10:00 450次阅读

    高性能时钟分配利器:LTC6953深度解析

    高性能时钟分配利器:LTC6953深度解析 在电子设计领域,时钟分配对于系统的稳定运行和性能表现至关重要。今天,我们就来深入探讨一款高性能的时钟分配芯片——LTC6953。 文件下载
    的头像 发表于 03-26 11:25 237次阅读

    ADSP - 21992:高性能混合信号 DSP 控制器的深度剖析

    ADSP - 21992:高性能混合信号 DSP 控制器的深度剖析 在电子工程领域,高性能的 DSP 控制器一直是推动各种应用发展的核心力量。今天,我们就来深入探讨一款功能强大的混合信号 DSP
    的头像 发表于 03-23 17:00 649次阅读

    如何确保CAT.1模组的高性能与低功耗?

    元器件数量和板级面积,从而降低了整体系统的功耗。 超轻量架构设计:芯片内部集成了定制的RISC-V协处理器,专门用于处理后台低负载任务(如心跳维持、传感器数据轮询)。主核可以在大部分时间处于深度休眠
    发表于 03-05 11:41

    TPS61042:高性能LED驱动芯片的深度解析

    TPS61042:高性能LED驱动芯片的深度解析 在电子设备的设计中,LED驱动芯片的性能直接影响着设备的显示效果和稳定性。TPS61042作为一款备受关注的LED驱动芯片,以其出色的性能
    的头像 发表于 02-27 16:15 359次阅读

    新品 | AI Pyramid AI Pyramid-Pro,面向本地推理与智能交互的高性能AI PC

    AIPyramid是一款金字塔形状的高性能AIPC,专为本地AI推理与边缘智能应用而生。内置AxeraAX8850SoC,集成八核Cortex-A55处理器与24TOPS@INT8NPU,轻松应对
    的头像 发表于 02-06 17:24 3926次阅读
    新品 | AI Pyramid AI Pyramid-Pro,面向本地<b class='flag-5'>推理</b>与智能交互的<b class='flag-5'>高性能</b>AI PC

    深度剖析UCC21750:用于SiC/IGBT的高性能单通道栅极驱动器

    深度剖析UCC21750:用于SiC/IGBT的高性能单通道栅极驱动器 在电力电子领域,栅极驱动器起着至关重要的作用。德州仪器(Texas Instruments)的UCC21750单通道栅极驱动器
    的头像 发表于 01-21 17:35 1718次阅读

    华邦高性能NOR Flash用于学习平板

    华邦电子(Winbond)的NOR Flash以其卓越性能成为学习平板理想的存储解决方案。其芯片内执行(XIP)特性可实现系统秒级快速启动,高可靠性确保固件和核心代码安全,低功耗特性则有效延长设备续航,为流畅稳定的学习体验奠定坚
    的头像 发表于 11-10 09:48 688次阅读
    华邦<b class='flag-5'>高性能</b>NOR Flash<b class='flag-5'>用于</b><b class='flag-5'>学习</b>平板

    一文了解Mojo编程语言

    CPU、GPU 和其他加速器的支持,简化了并行编程模型。 渐进式类型系统 结合静态类型检查和类型推导,既保证编译时安全性,又保留动态类型的灵活性。 应用场景 AI 与机器学习 用于训练大型模型和实时推理
    发表于 11-07 05:59

    eForce无线通信软件开发工具包兼容WLAN模块WKR612AA1

    近期,eForce株式会社宣布,其面向嵌入式设备的无线通信软件开发工具包(μC3-WLAN SDK)现已兼容 KAGA FEI 生产的无线局域网(WLAN)模块"WKR612AA1"。
    的头像 发表于 09-24 15:16 1781次阅读

    基于米尔瑞芯微RK3576开发板部署运行TinyMaix:超轻量级推理框架

    推理库,可以让你在任意低资源MCU上运行轻量级深度学习模型。关键特性核心代码少于 400行(tm_layers.c+tm_model.c+arch_cpu.h), 代码段(.text)少于3KB 低
    发表于 07-25 16:35

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    网络智能诊断平台。通过对私有化网络数据的定向训练,信而泰打造了高性能、高可靠性的网络诊断模型,显著提升了AI辅助诊断的精准度与实用性。该方案实现了网络全流量深度解析能力与AI智能推理分析能力的有机融合
    发表于 07-16 15:29

    IQM 宣布 Resonance 量子云平台重大升级,推出全新软件开发工具包

    进程,并为终端用户带来性能强大的新一代量子系统。 此次升级将 Qrisp——一个源自德国弗劳恩霍夫 FOKUS 研究所的项目——设为平台新的默认软件开发工具包 (SDK)。Qrisp 为量子开发者
    的头像 发表于 07-11 11:03 814次阅读

    大模型推理显存和计算量估计方法研究

    ,为实际应用提供了有益的参考。 未来,我们将继续深入研究大模型推理的优化方法,以降低显存和计算资源的需求,提高深度学习模型在实际应用中的性能
    发表于 07-03 19:43