0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赛灵思INT8优化为嵌入式视觉应用性能和计算方法

Xilinx赛灵思官微 来源:djl 作者:赛灵思 2019-07-29 11:19 次阅读

赛灵思 INT8 优化为使用深度学习推断和传统计算机视觉功能的嵌入式视觉应用提供最优异的性能和能效最出色的计算方法。与其他 FPGA DSP 架构相比,赛灵思的集成 DSP 架构在 INT8 深度学习运算上能实现 1.75 倍的解决方案级性能。

本白皮书探讨将 INT8 运算用于实现在赛灵思 DSP48E2 片上、使用深度学习推断和计算机视觉功能的嵌入式视觉应用,以及这种方案与其他 FPGA 的对比。与占用相同资源数量的其他 FPGA 相比,赛灵思的 DSP 架构对 INT8 乘法累加(MACC) 运算能实现 1.75 倍的峰值解决方案级性能。由于嵌入式视觉应用可以在不牺牲准确性的情况下使用较低位精度,因此需要高效的 INT8 实现方案。

赛灵思的 DSP 架构和库针对 INT8 运算进行了精心优化。本白皮书介绍如何使用赛灵思 16nm 和 20nm All Programmable 器件中的 DSP48E2 Slice,在共享相同内核权重的同时处理两个并行的 INT8 MACC 运算。本白皮书还阐述了要运用赛灵思这一独特技术,为何输入的最小位宽为 24 位。此外本白皮书还详细介绍了如何以 SIMD 模式使用 DSP48E2 Slice,供基本算术运算使用。另外还提供在深度学习领域或其他计算机视觉处理任务领域如何将这些功能用于嵌入式视觉的实例。

全书目录

用于深度学习和计算机视觉的 INT8

赛灵思 DSP Slice 片上的 INT8 运算

可扩展的 INT8 优化

DSP48E2 SIMD 模式

映射 INT8 优化到深度学习应用

创建 INT8 链接 MACC 的其他方法

映射 INT8 优化到计算机视觉功能

使用可扩展 INT8 优化的定制 2D 卷积

使用 SIMD 运算的中值滤波器

竞争分析

在竞争分析中使用英特尔的 Arria 10 器件与赛灵思的 Zynq UltraScale+ MPSoC 对比。在进行嵌入式视觉应用计算效率比较时,选择的器件有可比的 DSP 密度和器件功耗:

• Arria 10 SoC :SX220、SX270 和 SX480

• Zynq UltraScale+ MPSoC :ZU3、ZU7 和 ZU9 器件

重点比较能用于包括深度学习和计算机视觉在内的众多应用的通用 MACC 性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式视觉
    +关注

    关注

    8

    文章

    115

    浏览量

    59043
  • 算术运算
    +关注

    关注

    0

    文章

    6

    浏览量

    5662
收藏 人收藏

    评论

    相关推荐

    采用FPGA实现DisplayPort详细教程【内部资料】

    ,以及如何使用我们即将推出的 XAPP“使用 MicroBlazeTM 嵌入式系统实施 DisplayPort Source PolicyMaker 控制系统参考设计作者:Carol Fields
    发表于 03-01 11:10

    公司亚太区销售与市场副总裁给XILINX客户的信

    尊敬的客户朋友们:在此,我谨代表公司与您分享一个激动人心的喜讯: 3 月1 日,
    发表于 03-22 15:17

    用OpenCV和Vivado HLS加速基于Zynq SoC的嵌入式视觉应用开发

    设计流程  为了进一步帮助嵌入式视觉开发人员创建Smarter Vision系统,在Vivado中增加了对OpenCV
    发表于 04-21 15:49

    机器视觉计算方法

    机器视觉计算方法
    发表于 08-14 09:23

    XilinxFPGA技术及应用线上公开课

    ` 本帖最后由 MGJOY 于 2017-4-10 15:07 编辑 本周三,4月12日,FPGA技术及应用线上公开课。欢迎大家观看、学习交流~分享主题【
    发表于 04-10 15:06

    【AD新闻】新CEO访华绘蓝图,7nm ACAP平台要让CPU/GPU难企及

    的合作力度,以进一步推动计算加速、计算存储及网络加速领域的创新与部署。数据中心是一个快速普及技术的领域,以此为重点,可以让客户迅速受益于
    发表于 03-23 14:31

    用FPGA 嵌入式处理器实现高性能浮点元算

    每条指令的周期。此外,这些优化的实施方案可充分发挥器件的高性能 DSP 特性,以缩短运算符时延并减少逻辑计数与功耗。在其
    发表于 08-03 11:15

    海量干货分享!XDF(开发者大会)北京站各分论坛演讲资料公布

    中的研究与应用 - 科大讯飞基因组数据的 FPGA 超级计算系统 - SmartVSCTurbo-提升您的洞察力 - Sumup边缘计算分论坛面向嵌入式深度剖析的机器学习 - Xilinx使用支持
    发表于 01-03 15:19

    【PYNQ-Z2申请】基于PYNQ-Z2平台的图像实时力学测量

    PYNQ-Z2平台完善该项目的开源设计,并进一步提升性能。项目计划①根据文档,对赛PYNQ-Z2快速入门②通过学习
    发表于 01-09 14:49

    Xilinx方案

    能做方案的,请联系
    发表于 01-21 19:31

    ISE® 设计套件11.1版对FPGA有什么优化作用?

    每一版本都提供了完整的FPGA设计流程,并且专门针对特定的用户群体(工程师)和特定领域的设计方法及设计环境要求进行了优化。那大家知道I
    发表于 07-30 06:52

    多核处理器SoC设计怎么才能满足嵌入式系统应用?

    )解决方案成为现实。目前的挑战在于如何在该解决方案的范畴内快速完成设计的开发与创建。嵌入式开发套件(EDK)工具和IP具有很大的灵活性,那么多核处理器SoC设计怎么才能满足
    发表于 08-01 07:53

    嵌入式机器视觉系统有什么特性?怎么优化

    介绍了基于ARM+DSP架构的嵌入式机器视觉系统的特性,分析了制约嵌入式机器视觉系统性能的因素。从操作系统和应用程序方面,讨论了嵌入式机器
    发表于 03-11 06:47

    Xilinx INT8 优化开发嵌入式视觉

    赛灵思 INT8 优化为使用深度学习推断和传统计算视觉功能的嵌入式视觉应用提供最优异的
    的头像 发表于 09-22 17:27 5300次阅读

    赛灵思INT8优化为嵌入式视觉应用提供性能计算方法

    要使用可编程逻辑上的 DSP 实现中值滤波器,可以对算法做改动。每次比较运算可以分为减法运算及后续的符号位检查。对减法运算,DSP48E2 Slice 能够以四个 12 位或两个 24 位模式进行运算。要充分利用 DSP48E2 Slice,可以并行运算多个像素。
    的头像 发表于 07-30 08:59 2991次阅读
    赛灵思<b class='flag-5'>INT8</b><b class='flag-5'>优化为</b><b class='flag-5'>嵌入式</b><b class='flag-5'>视觉</b>应用提供<b class='flag-5'>性能</b>和<b class='flag-5'>计算方法</b>