0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale

YCqV_FPGA_EETre 2018-01-09 08:45 次阅读

随着人工智能AI)的不断发展,它已经从早期的人工特征工程进化到现在可以从海量数据中学习,机器视觉语音识别以及自然语言处理等领域都取得了重大突破。CNN(Convolutional Neural Network,卷积神经网络)在人工智能领域受到越来越多的青睐,它是深度学习技术中极具代表性的网络结构之一,尤其在图像处理领域取得了很大的成功。随着网络变得越来越大、越来越复杂,我们需要大量的计算资源来对其进行训练,因此人们纷纷将注意力转向FPGA(Field Programmable Gate Array,现场可编程门阵列)器件,FPGA不仅具有软件的可编程性和灵活性,同时又有ASIC高吞吐和低延迟的特性,而且由于具有丰富的I/O接口,FPGA还非常适合用作协议和接口转换的芯片

近日KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale,它能够利用实现训练好的CNN网络,比如行业标准的ResNet、AlexNet、Tiny Yolo和VGG-16等,并将它们进行压缩输出二进制描述文件,可以部署到Xilinx全系列可编程逻辑器件上。Zynq SoC和Zynq UltraScale+ MPSoC器件PS可以提供数据给AIScale CNN加速器(PL),经过分类处理将输出数据给PS。压缩后的CNN网络占用资源相对小很多,可以部署在片上存储器中,可以更快更灵活的切换CNN网络。

KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale

图1:AIScale在计算机视觉应用案例示意图

AIScale加速器的核心是AIScale RCC(Re-configurable Compute Core),用户根据需求可以灵活自定义AIScale RCC模块的数量,AIScale RCC支持卷积预处理、池化/采样、加权和全连接层等处理。资源更丰富的Zynq SoC和UltraScale+ MPSoC可以集成更多的AIScale RCC模块,这会给AIScale加速器带来更大的性能提升。当然也可以根据成本、系统功耗、性能需求集成一定的AIScale RCC模块,选择合适的Xilinx FPGA器件。

图2:多个 AIScale RCC模块级联连接

KORTIQ公司目前专注于嵌入式和计算机视觉领域,设计工业4.0和物联网IoT)等,未来将会为AIScale CNN加速器提供更多更先进的特性,比如图像分类、物体识别和追踪、人脸和语音识别、自然语言处理等,将先进的人工智能网络应用到自动化生产、控制等场景中,提高相关行业的生产力为用户带来更好的服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1602

    文章

    21307

    浏览量

    593113
  • Xilinx
    +关注

    关注

    70

    文章

    2119

    浏览量

    119364
  • IP
    IP
    +关注

    关注

    5

    文章

    1403

    浏览量

    148268
  • cnn
    cnn
    +关注

    关注

    3

    文章

    327

    浏览量

    21296

原文标题:介绍一款基于FPGA的CNN硬件加速器IP

文章出处:【微信号:FPGA-EETrend,微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    数据中心加速器就看GRVI Phalanx FPGA加速器

    数据中心采用FPGA加速器已经成为主流,像MS的Catapult,Amazon基于Xilinx FPGA的AWS F1,Intel的Altera,Baidu
    的头像 发表于 10-16 11:49 8598次阅读
    数据中心<b class='flag-5'>加速器</b>就看GRVI Phalanx <b class='flag-5'>FPGA</b><b class='flag-5'>加速器</b>

    采用Xilinx FPGA加速机器学习应用

    全球领先的中文互联网搜索引擎提供商百度正在采用赛灵思FPGA加速其中国数据中心的机器学习应用。两家公司正合作进步扩大FPGA
    发表于 12-15 17:15

    采用控制律加速器的Piccolo MCU

    一款 32 位浮点数学加速器,是 TI F2803x Piccolo MCU 系列独具的功能特性,能独立于 C28x 内核进行工作,从而可实现对片上外设的直接存取以及算法的并行执行。新型 MCU 建立在
    发表于 07-26 06:21

    TCP/IP通信协议在FPGA上怎么实现?

    实现,于是2001年Altera第次提出了可编程片上系统(SOPC)概念,并且推出了一款嵌入式处理软核Nios以及之后的第二代Nios
    发表于 03-09 06:50

    机器学习实战:GNN加速器FPGA解决方案

    的场景。如上所述种种设计挑战的存在,使得业界急需种可以支持高度并发实时计算、巨大内存容量和带宽、以及在数据中心范围可扩展的GNN加速解决方案。5. GNN加速器FPGA设计方案Ac
    发表于 10-20 09:48

    种基于FPGA的图神经网络加速器解决方案

    扩展到数据中心的GNN加速解决方案。基于FPGA设计方案的GNN加速器Achronix的Speedster®7t系列FPGA产品(以及该系列的第一款
    发表于 09-25 17:20

    一款低端14 MHz加速器Spitfire 500

    描述Spitfire 500,一款低端 14 MHz 加速器,带有 IDE 和用于 Amiga 500 的 4/8 MB 快速 RAM。代码https://github.com/jbilander/SF500
    发表于 07-05 06:01

    基于Fast Model的加速器软件开发

    方法高效地解决加速器配套驱动,框架,应用软件开发的问题呢?Fast Model!在Fast Model的例子系统中,arm给出了系列arm核,相关IP组合的子系统模型,以及相应OS,
    发表于 07-29 15:38

    使用AMD-Xilinx FPGA设计个AI加速器通道

    介绍使用 AMD-Xilinx FPGA设计个全连接DNN核心现在比较容易(Vitis AI),但是利用这个核心在 DNN 计算中使用它是另回事。本项目主要是设计AI
    发表于 02-21 15:01

    基于FPGA的通用CNN加速设计

    基于FPGA的通用CNN加速器整体框架如下,通过Caffe/Tensorflow/Mxnet等框架训练出来的CNN模型,通过编译器的一系列优化生成模型对应的指令;同时,图片数据和模型权
    发表于 10-27 14:09 9914次阅读
    基于<b class='flag-5'>FPGA</b>的通用<b class='flag-5'>CNN</b><b class='flag-5'>加速</b>设计

    一款Xilinx FPGACNN加速器IPAIScale

    随着人工智能(AI)的不断发展,它已经从早期的人工特征工程进化到现在可以从海量数据中学习,机器视觉、语音识别以及自然语言处理等领域都取得了重大突破。CNN(Convolutional Neural
    发表于 07-10 10:49 4411次阅读

    基于Xilinx FPGA的Memcached硬件加速器的介绍

    本教程讨论基于Xilinx FPGA的Memcached硬件加速器的技术细节,该硬件加速器可为10G以太网端口提供线速Memcached服务。
    的头像 发表于 11-27 06:41 3461次阅读

    Kortiq小巧高效的CNN加速器,支持所有类型

    Kortiq提供易于使用,可扩展且小巧的CNN加速器。 该设备支持所有类型的CNN,并动态加速网络中的不同层类型。
    的头像 发表于 11-23 06:28 2989次阅读

    电子学报第七期《一种可配置的CNN加速器FPGA实现方法》

    电子学报第七期《一种可配置的CNN加速器FPGA实现方法》
    发表于 11-18 16:31 15次下载

    基于FPGA的深度学习CNN加速器设计方案

    因为CNN的特有计算模式,通用处理器对于CNN实现效率并不高,不能满足性能要求。 因此,近来已经提出了基于FPGA,GPU甚至ASIC设计的各种加速
    发表于 06-14 16:03 1604次阅读
    基于<b class='flag-5'>FPGA</b>的深度学习<b class='flag-5'>CNN</b><b class='flag-5'>加速器</b>设计方案