0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最新一代深度神经网络推理装置xDNN的部分规格参数

DPVg_AI_era 来源:未知 作者:李倩 2018-08-31 09:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

继年初发布新一代FPGA框架后,FPGA巨头赛灵思在Hot Chips大会揭露了最新一代深度神经网络推理装置xDNN的部分规格参数。随着更多定制芯片的发展,现如今AI芯片的战火已经蔓延到推理领域。赛灵思的xDNN可配置、可复写,进行多任务处理,还配有Tensor内存。

目前来看,FPGA可能没有像一些人预期的那样在深度学习的训练空间中占据一席之地,但AI推理的低功耗、高频率需求非常适合可重复编程硬件的性能曲线。

然而,现在人们越来越专注于推理与训练的新体系架构,FPGA也在努力在定制化硬件领域保持领先,而这要靠一些高级编程工具来降低编程的复杂度。

目前,要判断通用CPUGPU、FPGA及定制芯片如何才能吸引最广泛的用户群还为时尚早,但基于云的FPGA以及不断发展的高级FPGA集,越来越多地作为实验工具使用,让FPGA在面向推理的任务中占据了一席之地。

考虑到所有这些因素,FPGA制造商Xilinx近日在Hot Chips大会上发布了Xilinx深度神经网络推理(xDNN)设备的一些参数细节,公司将在接下来10月1日举行的开发者大会上发布更多信息和性能基准。

就在几年前,神经网络训练处理器还是架构展上的耀眼明星,但最近,GPU已经在与定制化、专门化的ASIC芯片和其他通用硬件展开激烈竞争,眼下战火又蔓延到了推理任务领域。

Xilinx的数据中心和IP总监Rahul Nimaiyar上周在Hot Chips大会上表示,用FPGA执行推理任务具备坚实的硬件基础。FPGA的数据处理并行的,并且支持数据重用、数据压缩,能够应对数据稀疏。

xDNN处理器的2D二维MAC阵列,灵活的高带宽片载存储器,支持多种方式访问,让数据的传输和转移更加高效。此外,xDNN还支持灵活的数据类型(FP32 / FP16及INT 16/8/4/2等)。

xDNN是一个可配置、可复写的处理器,可以映射到FPGA上而无需重新编程。Xilinx还提供了深度神经网络特定指令集(如卷积,最大池化等),可适用于任何网络和任何大小的图像,还可以编译和运行新网络。也就是说,xDNN可以与TensorFlow一起使用,无需重新编程或更改FPGA。

Virtex硬件可以用于几种类型的存储器;从位于DSP模块旁边的分布式基础RAM到UltraRAM,再到高带宽内存和外部DDR4内存都可以,从而实现计算效率的优化和性能提升。

上图是一个通道并行脉动阵列(channel parallel systolic arrays)的放大示意图,图中所示为分布式加权缓冲区。处理元件被加权映射到DSP块上,具体权重保存在处理旁边分布式RAM中,该RAM容量很小,速度很快。换句话说,这些分布式RAM就是权重缓存。

xDNN的“Tensor内存”位于脉动阵列的旁边,并存储输入和输出的特征映射。该部分也是并行通道,因此该阵列中的每个行都与一行内存相关联。也就是说,xDNN可以进行多任务处理,在阵列上进行计算,同时还可以根据需要引入新的网络层。

与其他面向推理任务的芯片一样,xDNN也在芯片内压缩了尽量多的内置存储器,以保持芯片的活性。这是一种比较艰难的平衡做法,目的是为了保证计算效率,从下面的基准测试结果来看,Xilinx的配置似乎是有效的。

除了硬件之外,提升易用性也是关键问题,无论是对于那些使用F1进行深度学习的人,还是用FPGA编程实现更精细的点的人来说,编译器和运行时间都是关键指标。

上图是关于Xilinx为用户开发的机器学习工具套件的更多信息,实际上,这是一个允许用户连接至框架的API,可以更容易地在Tensorflow中获得经过训练的模型和权重,例如,将其转换为一个Xilinx图,在它到达编译器之前通过一些优化,生成所有必要的指令集,以便在xDNN上运行该网络。

Xilinx还提供了一个量化器,可以将经过训练的权重数据输入到一些校准集中,以找到范围并快速获得这些权重的量化结果。

Nimaiyar表示,Xilinx已经抽取出了产生有效推理的其他元素,包括操作的融合(一旦访问被激活,这些操作直接作为流程运算符执行,而不再返回Tensor Memory),当特征映射大小超过片载存储器空间时,会进行指令级的并行化处理,和自动将映射在层内平铺,这意味着xDNN可以处理任何规模的特征映射。

上图的稀疏基准测试是Xilinx在其开发者论坛上发布的结果,到目前为止,60-80%的跨框架高效数据表现已经足够令人期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106858
  • AI芯片
    +关注

    关注

    17

    文章

    2072

    浏览量

    36584

原文标题:【AI芯展开推理战】赛灵思最新深度神经网络推理器xDNN参数曝光

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是组高效的神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    在Ubuntu20.04系统中训练神经网络模型的些经验

    模型。 我们使用MNIST数据集,训练个卷积神经网络(CNN)模型,用于手写数字识别。旦模型被训练并保存,就可以用于对新图像进行推理和预测。要使用生成的模型进行
    发表于 10-22 07:03

    CICC2033神经网络部署相关操作

    在完成神经网络量化后,需要将神经网络部署到硬件加速器上。首先需要将所有权重数据以及输入数据导入到存储器内。 在仿真环境下,可将其存于个文件,并在 Verilog 代码中通过 readmemh 函数
    发表于 10-20 08:00

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    1.算法简介液态神经网络(LiquidNeuralNetworks,LNN)是种新型的神经网络架构,其设计理念借鉴自生物神经系统,特别是秀丽隐杆线虫的
    的头像 发表于 09-28 10:03 723次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    大模型推理显存和计算量估计方法研究

    (如全连接层、卷积层等)确定所需的显存大小; (3)将各层显存大小相加,得到模型总的显存需求。 基于神经网络剪枝的显存估计 神经网络剪枝是种减少模型参数数量的技术,可以降低显存需求。
    发表于 07-03 19:43

    无刷电机小波神经网络转子位置检测方法的研究

    摘要:论文通过对无刷电机数学模型的推导,得出转角:与三相相电压之间存在映射关系,因此构建了个以三相相电压为输人,转角为输出的小波神经网络来实现转角预测,并采用改进遗传算法来训练网络结构与参数
    发表于 06-25 13:06

    BP神经网络网络结构设计原则

    ,仅作为数据输入的接口。输入层的神经元个数通常与输入数据的特征数量相对应。 隐藏层 :对输入信号进行非线性变换,是神经网络的核心部分,负责学习输入与输出之间的复杂映射关系。隐藏层可以有
    的头像 发表于 02-12 16:41 1272次阅读

    BP神经网络与卷积神经网络的比较

    BP神经网络与卷积神经网络在多个方面存在显著差异,以下是对两者的比较: 、结构特点 BP神经网络 : BP神经网络
    的头像 发表于 02-12 15:53 1358次阅读

    如何优化BP神经网络的学习率

    优化BP神经网络的学习率是提高模型训练效率和性能的关键步骤。以下是些优化BP神经网络学习率的方法: 、理解学习率的重要性 学习率决定了模型参数
    的头像 发表于 02-12 15:51 1461次阅读

    BP神经网络的优缺点分析

    BP神经网络(Back Propagation Neural Network)作为种常用的机器学习模型,具有显著的优点,同时也存在些不容忽视的缺点。以下是对BP神经网络优缺点的分析
    的头像 发表于 02-12 15:36 1623次阅读

    什么是BP神经网络的反向传播算法

    BP神经网络的反向传播算法(Backpropagation Algorithm)是种用于训练神经网络的有效方法。以下是关于BP神经网络的反向传播算法的介绍:
    的头像 发表于 02-12 15:18 1312次阅读

    BP神经网络深度学习的关系

    BP神经网络深度学习之间存在着密切的关系,以下是对它们之间关系的介绍: 、BP神经网络的基本概念 BP神经网络,即反向传播
    的头像 发表于 02-12 15:15 1372次阅读

    BP神经网络的基本原理

    输入层、隐藏层和输出层组成。其中,输入层负责接收外部输入数据,这些数据随后被传递到隐藏层。隐藏层是BP神经网络的核心部分,它可以通过层或多层神经元对输入数据进行加权求和,并通过非线性
    的头像 发表于 02-12 15:13 1556次阅读

    深度学习入门:简单神经网络的构建与实现

    深度学习中,神经网络是核心模型。今天我们用 Python 和 NumPy 构建个简单的神经网络神经网络由多个
    的头像 发表于 01-23 13:52 859次阅读

    人工神经网络的原理和多种神经网络架构方法

    在上篇文章中,我们介绍了传统机器学习的基础知识和多种算法。在本文中,我们会介绍人工神经网络的原理和多种神经网络架构方法,供各位老师选择。 01 人工神经网络   人工
    的头像 发表于 01-09 10:24 2279次阅读
    人工<b class='flag-5'>神经网络</b>的原理和多种<b class='flag-5'>神经网络</b>架构方法