KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP—

随着人工智能（AI）的不断发展，它已经从早期的人工特征工程进化到现在可以从海量数据中学习，机器视觉、语音识别以及自然语言处理等领域都取得了重大突破。CNN（Convolutional Neural Network，卷积神经网络）在人工智能领域受到越来越多的青睐，它是深度学习技术中极具代表性的网络结构之一，尤其在图像处理领域取得了很大的成功。随着网络变得越来越大、越来越复杂，我们需要大量的计算资源来对其进行训练，因此人们纷纷将注意力转向FPGA（Field Programmable Gate Array，现场可编程门阵列）器件，FPGA不仅具有软件的可编程性和灵活性，同时又有ASIC高吞吐和低延迟的特性，而且由于具有丰富的I/O接口，FPGA还非常适合用作协议和接口转换的芯片。

近日KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale，它能够利用实现训练好的CNN网络，比如行业标准的ResNet、AlexNet、Tiny Yolo和VGG-16等，并将它们进行压缩输出二进制描述文件，可以部署到Xilinx全系列可编程逻辑器件上。Zynq SoC和Zynq UltraScale+ MPSoC器件PS可以提供数据给AIScale CNN加速器（PL），经过分类处理将输出数据给PS。压缩后的CNN网络占用资源相对小很多，可以部署在片上存储器中，可以更快更灵活的切换CNN网络。

KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale

图1：AIScale在计算机视觉应用案例示意图

AIScale加速器的核心是AIScale RCC（Re-configurable Compute Core），用户根据需求可以灵活自定义AIScale RCC模块的数量，AIScale RCC支持卷积预处理、池化/采样、加权和全连接层等处理。资源更丰富的Zynq SoC和UltraScale+ MPSoC可以集成更多的AIScale RCC模块，这会给AIScale加速器带来更大的性能提升。当然也可以根据成本、系统功耗、性能需求集成一定的AIScale RCC模块，选择合适的Xilinx FPGA器件。

图2：多个 AIScale RCC模块级联连接

KORTIQ公司目前专注于嵌入式和计算机视觉领域，设计工业4.0和物联网（IoT）等，未来将会为AIScale CNN加速器提供更多更先进的特性，比如图像分类、物体识别和追踪、人脸和语音识别、自然语言处理等，将先进的人工智能网络应用到自动化生产、控制等场景中，提高相关行业的生产力为用户带来更好的服务。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

FPGA

FPGA

+关注

关注
1602

文章
21307

浏览量
593113
Xilinx

Xilinx

+关注

关注
70

文章
2119

浏览量
119364
IP

IP

+关注

关注
5

文章
1403

浏览量
148268
cnn

cnn

+关注

关注
3

文章
327

浏览量
21296

原文标题：介绍一款基于FPGA的CNN硬件加速器IP

文章出处：【微信号：FPGA-EETrend，微信公众号：FPGA开发圈】欢迎添加关注！文章转载请注明出处。

数据中心加速器就看GRVI Phalanx FPGA加速器

数据中心采用FPGA做加速器已经成为主流，像MS的Catapult，Amazon基于Xilinx FPGA的AWS F1，Intel的Altera，Baidu

发表于 10-16 11:49 •8598次阅读

数据中心<b class='flag-5'>加速器</b>就看GRVI Phalanx <b class='flag-5'>FPGA</b><b class='flag-5'>加速器</b>

采用Xilinx FPGA加速机器学习应用

全球领先的中文互联网搜索引擎提供商百度正在采用赛灵思FPGA加速其中国数据中心的机器学习应用。两家公司正合作进一步扩大FPGA

发表于 12-15 17:15

采用控制律加速器的Piccolo MCU

是一款 32 位浮点数学加速器，是 TI F2803x Piccolo MCU 系列独具的功能特性，能独立于 C28x 内核进行工作，从而可实现对片上外设的直接存取以及算法的并行执行。新型 MCU 建立在

发表于 07-26 06:21

TCP／IP通信协议在FPGA上怎么实现？

实现，于是2001年Altera第一次提出了可编程片上系统(SOPC)概念，并且推出了第一款嵌入式处理器软核Nios以及之后的第二代Nios

发表于 03-09 06:50

机器学习实战：GNN加速器的FPGA解决方案

的场景。如上所述种种设计挑战的存在，使得业界急需一种可以支持高度并发实时计算、巨大内存容量和带宽、以及在数据中心范围可扩展的GNN加速解决方案。5. GNN加速器的FPGA设计方案Ac

发表于 10-20 09:48

一种基于FPGA的图神经网络加速器解决方案

扩展到数据中心的GNN加速解决方案。基于FPGA设计方案的GNN加速器Achronix的Speedster®7t系列FPGA产品（以及该系列的第一款

发表于 09-25 17:20

一款低端14 MHz加速器Spitfire 500

描述Spitfire 500，一款低端 14 MHz 加速器，带有 IDE 和用于 Amiga 500 的 4/8 MB 快速 RAM。代码https://github.com/jbilander/SF500

发表于 07-05 06:01

基于Fast Model的加速器软件开发

方法高效地解决加速器配套驱动，框架，应用软件开发的问题呢？Fast Model！在Fast Model的例子系统中，arm给出了一系列arm核，相关IP组合的子系统模型，以及相应OS，

发表于 07-29 15:38

使用AMD-Xilinx FPGA设计一个AI加速器通道

介绍使用 AMD-Xilinx FPGA设计一个全连接DNN核心现在比较容易（Vitis AI），但是利用这个核心在 DNN 计算中使用它是另一回事。本项目主要是设计AI

发表于 02-21 15:01

基于FPGA的通用CNN加速设计

基于FPGA的通用CNN加速器整体框架如下，通过Caffe/Tensorflow/Mxnet等框架训练出来的CNN模型，通过编译器的一系列优化生成模型对应的指令;同时，图片数据和模型权

发表于 10-27 14:09 •9914次阅读

一款Xilinx FPGA的CNN加速器IP—AIScale

随着人工智能（AI）的不断发展，它已经从早期的人工特征工程进化到现在可以从海量数据中学习，机器视觉、语音识别以及自然语言处理等领域都取得了重大突破。CNN（Convolutional Neural

发表于 07-10 10:49 •4411次阅读

基于Xilinx FPGA的Memcached硬件加速器的介绍

本教程讨论基于Xilinx FPGA的Memcached硬件加速器的技术细节，该硬件加速器可为10G以太网端口提供线速Memcached服务。

发表于 11-27 06:41 •3461次阅读

Kortiq小巧高效的CNN加速器，支持所有类型

Kortiq提供易于使用，可扩展且小巧的CNN加速器。该设备支持所有类型的CNN，并动态加速网络中的不同层类型。

发表于 11-23 06:28 •2989次阅读

电子学报第七期《一种可配置的CNN协加速器的FPGA实现方法》

电子学报第七期《一种可配置的CNN协加速器的FPGA实现方法》

发表于 11-18 16:31 •15次下载

基于FPGA的深度学习CNN加速器设计方案

因为CNN的特有计算模式，通用处理器对于CNN实现效率并不高，不能满足性能要求。因此，近来已经提出了基于FPGA，GPU甚至ASIC设计的各种加速

发表于 06-14 16:03 •1604次阅读

搜索历史

KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale

评论

数据中心加速器就看GRVI Phalanx FPGA加速器

采用Xilinx FPGA加速机器学习应用

采用控制律加速器的Piccolo MCU

TCP／IP通信协议在FPGA上怎么实现？

机器学习实战：GNN加速器的FPGA解决方案

一种基于FPGA的图神经网络加速器解决方案

一款低端14 MHz加速器Spitfire 500

基于Fast Model的加速器软件开发

使用AMD-Xilinx FPGA设计一个AI加速器通道

基于FPGA的通用CNN加速设计

一款Xilinx FPGA的CNN加速器IP—AIScale

基于Xilinx FPGA的Memcached硬件加速器的介绍

Kortiq小巧高效的CNN加速器，支持所有类型

电子学报第七期《一种可配置的CNN协加速器的FPGA实现方法》

基于FPGA的深度学习CNN加速器设计方案