最新一代深度神经网络推理装置xDNN的部分规格参数-电子发烧友网

继年初发布新一代FPGA框架后，FPGA巨头赛灵思在Hot Chips大会揭露了最新一代深度神经网络推理装置xDNN的部分规格参数。随着更多定制芯片的发展，现如今AI芯片的战火已经蔓延到推理领域。赛灵思的xDNN可配置、可复写，进行多任务处理，还配有Tensor内存。

目前来看，FPGA可能没有像一些人预期的那样在深度学习的训练空间中占据一席之地，但AI推理的低功耗、高频率需求非常适合可重复编程硬件的性能曲线。

然而，现在人们越来越专注于推理与训练的新体系架构，FPGA也在努力在定制化硬件领域保持领先，而这要靠一些高级编程工具来降低编程的复杂度。

目前，要判断通用CPU、GPU、FPGA及定制芯片如何才能吸引最广泛的用户群还为时尚早，但基于云的FPGA以及不断发展的高级FPGA集，越来越多地作为实验工具使用，让FPGA在面向推理的任务中占据了一席之地。

考虑到所有这些因素，FPGA制造商Xilinx近日在Hot Chips大会上发布了Xilinx深度神经网络推理（xDNN）设备的一些参数细节，公司将在接下来10月1日举行的开发者大会上发布更多信息和性能基准。

就在几年前，神经网络训练处理器还是架构展上的耀眼明星，但最近，GPU已经在与定制化、专门化的ASIC芯片和其他通用硬件展开激烈竞争，眼下战火又蔓延到了推理任务领域。

Xilinx的数据中心和IP总监Rahul Nimaiyar上周在Hot Chips大会上表示，用FPGA执行推理任务具备坚实的硬件基础。FPGA的数据处理并行的，并且支持数据重用、数据压缩，能够应对数据稀疏。

xDNN处理器的2D二维MAC阵列，灵活的高带宽片载存储器，支持多种方式访问，让数据的传输和转移更加高效。此外，xDNN还支持灵活的数据类型（FP32 / FP16及INT 16/8/4/2等）。

xDNN是一个可配置、可复写的处理器，可以映射到FPGA上而无需重新编程。Xilinx还提供了深度神经网络特定指令集（如卷积，最大池化等），可适用于任何网络和任何大小的图像，还可以编译和运行新网络。也就是说，xDNN可以与TensorFlow一起使用，无需重新编程或更改FPGA。

Virtex硬件可以用于几种类型的存储器；从位于DSP模块旁边的分布式基础RAM到UltraRAM，再到高带宽内存和外部DDR4内存都可以，从而实现计算效率的优化和性能提升。

上图是一个通道并行脉动阵列（channel parallel systolic arrays）的放大示意图，图中所示为分布式加权缓冲区。处理元件被加权映射到DSP块上，具体权重保存在处理旁边分布式RAM中，该RAM容量很小，速度很快。换句话说，这些分布式RAM就是权重缓存。

xDNN的“Tensor内存”位于脉动阵列的旁边，并存储输入和输出的特征映射。该部分也是并行通道，因此该阵列中的每个行都与一行内存相关联。也就是说，xDNN可以进行多任务处理，在阵列上进行计算，同时还可以根据需要引入新的网络层。

与其他面向推理任务的芯片一样，xDNN也在芯片内压缩了尽量多的内置存储器，以保持芯片的活性。这是一种比较艰难的平衡做法，目的是为了保证计算效率，从下面的基准测试结果来看，Xilinx的配置似乎是有效的。

除了硬件之外，提升易用性也是关键问题，无论是对于那些使用F1进行深度学习的人，还是用FPGA编程实现更精细的点的人来说，编译器和运行时间都是关键指标。

上图是关于Xilinx为用户开发的机器学习工具套件的更多信息，实际上，这是一个允许用户连接至框架的API，可以更容易地在Tensorflow中获得经过训练的模型和权重，例如，将其转换为一个Xilinx图，在它到达编译器之前通过一些优化，生成所有必要的指令集，以便在xDNN上运行该网络。

Xilinx还提供了一个量化器，可以将经过训练的权重数据输入到一些校准集中，以找到范围并快速获得这些权重的量化结果。

Nimaiyar表示，Xilinx已经抽取出了产生有效推理的其他元素，包括操作的融合（一旦访问被激活，这些操作直接作为流程运算符执行，而不再返回Tensor Memory），当特征映射大小超过片载存储器空间时，会进行指令级的并行化处理，和自动将映射在层内平铺，这意味着xDNN可以处理任何规模的特征映射。

上图的稀疏基准测试是Xilinx在其开发者论坛上发布的结果，到目前为止，60-80％的跨框架高效数据表现已经足够令人期待。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4572

浏览量
98714
AI芯片

AI芯片

+关注

关注
17

文章
1648

浏览量
34379

原文标题：【AI芯展开推理战】赛灵思最新深度神经网络推理器xDNN参数曝光

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

详解深度学习、神经网络与卷积神经网络的应用

在如今的网络时代，错综复杂的大数据和网络环境，让传统信息处理理论、人工智能与人工神经网络都面临巨大的挑战。近些年，深度学习逐渐走进人们的视线，通过深

发表于 01-11 10:51 •711次阅读

卷积神经网络的优点

卷积神经网络的优点卷积神经网络（Convolutional Neural Network，CNN）是一种基于深度学习的神经网络模型，在图像识别、语音识别、自然语言处理等领域有着广泛

发表于 12-07 15:37 •2950次阅读

浅析深度神经网络压缩与加速技术

深度神经网络是深度学习的一种框架，它是一种具备至少一个隐层的神经网络。与浅层神经网络类似

发表于 10-11 09:14 •393次阅读

《 AI加速器架构设计与实现》+第一章卷积神经网络观后感

连接块是一种模块，通常用于深度卷积神经网络中，特别是在残差网络（Residual Network，ResNet）中广泛使用，也是我比较熟悉的。组卷积块是

发表于 09-11 20:34

深度学习的神经网络架构解析

感知器是所有神经网络中最基本的，也是更复杂的神经网络的基本组成部分。它只连接一个输入神经元和一个输出神经元。

发表于 08-31 16:55 •843次阅读

卷积神经网络主要包括哪些卷积神经网络组成部分

卷积神经网络主要包括哪些卷积神经网络组成部分卷积神经网络（CNN）是一类广泛应用于计算机视觉、自然语言处理等领域的人工神经网络。它具有良

发表于 08-21 17:15 •1092次阅读

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别

深度神经网络是一种基于神经网络的机器学习算法，其主要特点是由多层神经元构成，可以根据数据自动调整神经元之间的权重，从而实现对大规模数据进行预

发表于 08-21 17:07 •2313次阅读

卷积神经网络的基本原理卷积神经网络发展卷积神经网络三大特点

卷积神经网络的基本原理卷积神经网络发展历程卷积神经网络三大特点卷积神经网络的基本原理卷积神经网络（Convolutional Ne

发表于 08-21 16:49 •1435次阅读

卷积神经网络三大特点

卷积神经网络三大特点卷积神经网络（Convolutional Neural Network，CNN）是一种深度学习模型，其具有三大特点：局部感知、参数共享和下采样。一、局部感知

发表于 08-21 16:49 •3567次阅读

卷积神经网络模型有哪些？卷积神经网络包括哪几层内容？

卷积神经网络模型有哪些？卷积神经网络包括哪几层内容？卷积神经网络（Convolutional Neural Networks，CNN）是深度学习领域中最广泛应用的模型之一，主要应用于

发表于 08-21 16:41 •1507次阅读

卷积神经网络原理：卷积神经网络模型和卷积神经网络算法

卷积神经网络原理：卷积神经网络模型和卷积神经网络算法卷积神经网络（Convolutional Neural Network，CNN）是一种基于深度

发表于 08-17 16:30 •913次阅读

PyTorch教程10.3之深度递归神经网络

电子发烧友网站提供《PyTorch教程10.3之深度递归神经网络.pdf》资料免费下载

发表于 06-05 15:12 •0次下载

浅析三种主流深度神经网络

来源：青榴实验室1、引子深度神经网络(DNNs)最近在图像分类或语音识别等复杂机器学习任务中表现出的优异性能令人印象深刻。在本文中，我们将了解深度神经网络的基础知识和三个最流行

发表于 05-17 09:59 •1071次阅读

浅析三种主流深度神经网络

来源：青榴实验室 1、引子深度神经网络(DNNs)最近在图像分类或语音识别等复杂机器学习任务中表现出的优异性能令人印象深刻。在本文中，我们将了解深度神经网络的基础知识和三个最流行

发表于 05-15 14:20 •608次阅读

三个最流行神经网络

在本文中，我们将了解深度神经网络的基础知识和三个最流行神经网络：多层神经网络(MLP)，卷积神经网络(CNN)和递归

发表于 05-15 14:19 •1174次阅读