0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Xilinx INT8 优化开发嵌入式视觉

C29F_xilinx_inc 来源:互联网 作者:佚名 2017-09-22 17:27 次阅读

赛灵思 INT8 优化为使用深度学习推断和传统计算机视觉功能的嵌入式视觉应用提供最优异的性能和能效最出色的计算方法。与其他 FPGA DSP 架构相比,赛灵思的集成 DSP 架构在 INT8 深度学习运算上能实现 1.75 倍的解决方案级性能。

本白皮书探讨将 INT8 运算用于实现在赛灵思 DSP48E2 片上、使用深度学习推断和计算机视觉功能的嵌入式视觉应用,以及这种方案与其他 FPGA 的对比。与占用相同资源数量的其他 FPGA 相比,赛灵思的 DSP 架构对 INT8 乘法累加(MACC) 运算能实现 1.75 倍的峰值解决方案级性能。由于嵌入式视觉应用可以在不牺牲准确性的情况下使用较低位精度,因此需要高效的 INT8 实现方案。

赛灵思的 DSP 架构和库针对 INT8 运算进行了精心优化。本白皮书介绍如何使用赛灵思 16nm 和 20nm All Programmable 器件中的 DSP48E2 Slice,在共享相同内核权重的同时处理两个并行的 INT8 MACC 运算。本白皮书还阐述了要运用赛灵思这一独特技术,为何输入的最小位宽为 24 位。此外本白皮书还详细介绍了如何以 SIMD 模式使用 DSP48E2 Slice,供基本算术运算使用。另外还提供在深度学习领域或其他计算机视觉处理任务领域如何将这些功能用于嵌入式视觉的实例。

全书目录

用于深度学习和计算机视觉的 INT8

赛灵思 DSP Slice 片上的 INT8 运算

可扩展的 INT8 优化

DSP48E2 SIMD 模式

映射 INT8 优化到深度学习应用

创建 INT8 链接 MACC 的其他方法

映射 INT8 优化到计算机视觉功能

使用可扩展 INT8 优化的定制 2D 卷积

使用 SIMD 运算的中值滤波器

竞争分析

在竞争分析中使用英特尔的 Arria 10 器件与赛灵思的 Zynq® UltraScale+ ™ MPSoC 对比。在进行嵌入式视觉应用计算效率比较时,选择的器件有可比的 DSP 密度和器件功耗:

• Arria 10 SoC :SX220、SX270 和 SX480

• Zynq UltraScale+ MPSoC :ZU3、ZU7 和 ZU9 器件

重点比较能用于包括深度学习和计算机视觉在内的众多应用的通用 MACC 性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • dsp
    dsp
    +关注

    关注

    544

    文章

    7682

    浏览量

    344352
  • Xilinx
    +关注

    关注

    70

    文章

    2121

    浏览量

    119372
  • INT8
    +关注

    关注

    0

    文章

    1

    浏览量

    1627

原文标题:利用 Xilinx 器件上的 INT8 优化开发嵌入式视觉

文章出处:【微信号:xilinx_inc,微信公众号:赛灵思】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Xilinx嵌入式系统开发环境EDK

    Xilinx嵌入式系统开发环境EDK
    发表于 08-17 09:21

    嵌入式视觉的发展机遇

    硬件、半导体和软件元器件供应商,子系统开发人员、系统集成商,以及最终用户,还有实现未来突破的基础研究等。本文主要关注图中显示的嵌入式视觉算法处理技术。
    发表于 05-16 10:45

    智能嵌入式视觉系统有哪些技术瓶颈和解决方法

    了一系列视觉应用解决方案,比如PicoZed嵌入式视觉开发套件,其中PicoZed SoM集成的是Xilinx Zynq-7030 All
    发表于 08-08 06:53

    嵌入式视觉技术是什么?

    r随着功能越来越强大的处理器、图像传感器、存储器和其他半导体器件以及相关算法的出现,可以在多种嵌入式系统中实现计算机视觉功能,通过视频输入来分析周围环境。微软的Kinect游戏控制器
    发表于 08-22 06:43

    嵌入式机器视觉系统有什么特性?怎么优化

    介绍了基于ARM+DSP架构的嵌入式机器视觉系统的特性,分析了制约嵌入式机器视觉系统性能的因素。从操作系统和应用程序方面,讨论了嵌入式机器
    发表于 03-11 06:47

    求一种基于UML的嵌入式系统可视化开发方法

    本文结合统一建模语言UML,提出一种嵌入式系统可视化开发方法,并将其实际运用到了嵌入式远程温度监控系统的开发过程中,验证了该方法的可行性和有效性。
    发表于 04-27 06:47

    浅析MATLAB和Simulink嵌入式视觉应用

    嵌入式视觉是什么?嵌入式视觉是指将图像处理和计算机视觉应用到嵌入式系统。
    发表于 12-04 08:00

    可视化开发平台8ms的相关资料推荐

    作为一个嵌入式开发小白,时常苦于无法快速输出原型、UI设计内部跨部门走流程又十分浪费时间,直到我遇到了一个简单好用又好学的嵌入式开发工具平台,强烈安利给和我有一样苦恼的开发者们!这个平台叫8
    发表于 12-14 08:18

    基于UML的嵌入式系统可视化开发

      1 引言    本文结合统一建模语言UML,提出一种嵌入式系统可视化开发方法,并将其实际运用到了嵌入式远程温度监控系统的开发过程中,验证了该方法的可行性和有
    发表于 09-02 09:58 882次阅读
    基于UML的<b class='flag-5'>嵌入式</b>系统可视<b class='flag-5'>化开发</b>

    玩转Xilinx嵌入式视觉开发者专区 让视觉系统开发更加简单

    开发下一代视觉系统的 “一站式平台” ——Xilinx嵌入式视觉开发者专区 赛灵思近日推出了面向
    发表于 11-10 14:49 822次阅读

    DSP48E2 Slice 上优化 INT8 深度学习运算分析

    。赛灵思的 DSP 架构和库专门针对 INT8 深度学习推断进行了优化。本白皮书介绍如何使用赛灵思 UltraScale 和 UltraScale+ FPGA 中的DSP48E2,在共享相同内核权重的同时处理两个
    发表于 11-16 14:23 1.4w次阅读
    DSP48E2 Slice 上<b class='flag-5'>优化</b> <b class='flag-5'>INT8</b> 深度学习运算分析

    Xilinx嵌入式视觉开发者专区的详细介绍

    Xilinx近日推出了面向软件,硬件及系统开发人员的嵌入式视觉开发者专区,通过“一站式平台”帮助他们加速生产力并打造All Programm
    的头像 发表于 11-29 06:04 2000次阅读

    嵌入式视觉的最新趋势讨论

    Xilinx嵌入式视觉战略营销总监Aaron Behman讨论了嵌入式视觉的最新趋势以及Xilinx
    的头像 发表于 11-22 06:31 2769次阅读

    赛灵思INT8优化嵌入式视觉应用性能和计算方法

    赛灵思的 DSP 架构和库针对 INT8 运算进行了精心优化。本白皮书介绍如何使用赛灵思 16nm 和 20nm All Programmable 器件中的 DSP48E2 Slice,在共享相同内核权重的同时处理两个并行的 INT8
    的头像 发表于 07-29 11:19 2324次阅读

    Int8量化-ncnn社区Int8重构之路

    本文是对NCNN社区int8模块的重构开发,再也不用担心溢出问题了,速度也还行。作者:圈圈虫首发知乎传送门ncnnBUG1989/caffe-int8-conver...
    发表于 02-07 12:38 1次下载
    <b class='flag-5'>Int8</b>量化-ncnn社区<b class='flag-5'>Int8</b>重构之路