侵权投诉

浅谈DNN中应用FPGA的作用分析

FPGA开发圈 2019-11-28 17:19 次阅读

引言

深度神经网络(deep neural network)是机器学习发展20年来取得的最大突破,比如在语音识别方面,相比于传统方法,其将错误率降低了30%;而在2011年的图片识别竞赛上,将错误率从26%降低到3.5%,这些使得处于发展低谷的人工智能突然热门起来,从学术界扩展到工业界,甚至在google的alpha go击败了顶级围棋大师李世石后,人工智能成为全民讨论的热门,所有的程序员都梦想转行机器学习。

DNN中应用最广泛的是CNN和RNN,CNN是一种卷积网络,在图片识别分类中用的较多,RNN可以处理时间序列的信息,比如视频识别和语音识别。这些DNN结构通常很深,计算量也很大。比如VGG16用来处理1000种图片类别,有550MB的权重数据,完成一个分类就需要31Gop(operations)。为了降低计算量和访问内存时间,有两种方法:量化和降低权重。量化是减小权重或者激活数据的精度,比如从32bit浮点量化到8bit甚至1bit,就减小了数据量。降低权重包括剪枝和结构简化,这两种方法可以去除多余的权重参数。

DNN包括训练和推理两个阶段,训练是一个学习过程,通过不断的对权重进行迭代更新而使得网络获得智能。而推理阶段是给出一定输入后,网络会根据之前学习到的知识,输出准确结果。为了使得结果具有更高准确率,训练是进行浮点运算,同时涉及到大量的微分运算,所以训练通常由GPU完成。但是训练是一次性的,当训练完成,网络就可以直接用于推断而不需要再进行训练。FPGA就是用于推理过程,相比于CPU,具有更加灵活可编程的特点。可以针对DNN的特性增加运算并行度,调整内存访问,比CPU获得更高的实现效果。本章对自己基于FPGA进行DNN设计的经验做一个总结,包括对网络模型的一些体会,以及FPGA设计架构的一些思路,抛砖引玉,期待更多热爱AI加速的同学们加入讨论。

1、DNN模型

不论是CNN还是RNN,一个共同特点是整个网络是由几个相同的单元联结形成的。CNN中基本的单元是神经元,一个神经元包含一个权重和激活函数,其中权重是对输入信息进行卷积(图1.1),几乎大部分运算量都集中在卷积运算中。激活函数是对卷积后的结果进行非线性运算,激活函数有很多,像Relu,sigmoid等。基本的CNN网络结构如图1.2,网络每层都由多个神经元构成,每个神经元的输入来自上一层的输出,本层输出作为下一层的输入。每层的输入通道是上一层神经元的个数,输出通道是这一层神经元个数。每个神经元对应不同输入通道的数据都有不同的权重数据(即kernel),这些权重和对应输入通道的图像完成卷积之后再求和,最后通过非线性激活函数给出输出通道的值。我们用伪代码来表示一层网络的运算过程:

其中内四层循环是图像和权重的卷积运算,FPGA就是利用这6层循环进行加速。从这伪代码中可以看出每个乘法都是相互独立的,不会依赖于其他运算,而加法包含两种,一种是在卷积运算中,另外一种是每个输入通道卷积后的数据要求和。

For(int o=0;o
其中内四层循环是图像和权重的卷积运算,FPGA就是利用这6层循环进行加速。从这伪代码中可以看出每个乘法都是相互独立的,不会依赖于其他运算,而加法包含两种,一种是在卷积运算中,另外一种是每个输入通道卷积后的数据要求和。


图1.1 图像卷积


图1.2 CNN网络结构 另外一种比较常用的网络是RNN,这是一种循环神经网络,具有记忆功能,可以处理时序信息。这里重点介绍一下LSTM网络,LSTM也是一种RNN。但是其增加了多个门控:记忆门,输入门,输出门等。这些门解决了梯度消失和发散的问题,能够处理更长时序的信息。所以在语音识别和视频识别方面有重要应用。LSTM原理的介绍可以参见《LSTM原理》。FPGA更多的关心其中有哪些运算,LSTM中主要包含矩阵乘法,向量求和,激活操作,向量点乘等。矩阵乘法消耗最多的运算资源,如何优化这种运算是FPGA实现加速的关键。 对于矩阵乘法,根据其乘法顺序有一下几种方式。 1)  小矩阵x小矩阵 A每次获得nxm块数据,和B的mxv块数据相乘,然后A移动nxm块,B向下移动mxv块,再次相乘并且和之前结果累加,当A移动到右端,B同时移动到底端,完成C中nxv矩阵块。A中数据复用率在V次。

图1.3 小矩阵x小矩阵

2)  列向量x行向量

A每次获得nx1列向量,B获得1xn行向量,二者进行叉乘,得到nxn个矩阵数据,然后A向右移动,同时B向下移动,二者叉乘结果和上一次进行累加,最后当A移动到右端,B到底端,得到了一个nxn大小的C矩阵块。A中数据复用率在n次。


图1.4列向量x行向量 对比这两种计算方式,第一种A数据复用率取决于B矩阵列大小。A可以看做权重,B看做输入的图像或者声音信息,如果输入信息“宽度不够”,那么权重利用率低,就会造成运算比搬运数据慢,造成带宽瓶颈。第二种方式A仅仅需要n个数,就能参与n*n次乘法,利用率较高。这能够很大缓解带宽瓶颈。但是如果B的宽度较小或者B为向量,那么就会造成算力较低,搬运进n个数只能计算n次乘法。如何选择需要根据实际情况来决定。

2、量化和减少权重

虽然浮点数能够表示更高的数据精度和更大的数据宽度,但是浮点数据占用的存储资源和运算资源都较大,造成推理时间较长。随着网络的复杂和加深,对推理延时的要求越来越高,因此通过必要手段来压缩网络模型,降低推理延时显得非常重要。压缩网络模型主要有两种方式:量化和减少权重。

1)定点化。
通过仿射变换将浮点数等效的映射到定点数空间,比如对于一个分布范围在(Xmin, Xmax)的权重数据,需要映射到(0,N-1)区间,其中N是定点可以表示的数据范围。浮点数就可以通过一个尺度和偏移量来表示为: 其中Z为0点偏移量,也是定点数据,S为尺度大小,用浮点数表示。在计算卷积的时候,就可以将尺度因子提取出来进行后处理,而乘法和加法运算使用定点完成。比如对于一个卷积运算可以表示为: 2)  二值化

二值化就是将参数量化到两个值{-1, 1},和一个尺度参数。二值化网络大大降低了运算和参数存储,但是也对网络精度有很大削弱,所以应用范围很窄,比如用在MNIST和CIFAR-10这样比较小的数据集中。对于定点乘法一般都是用DSP实现,所以算力大小受到了FPGA中DSP数量的限制。而二值化网络的乘法运算可以通过简单的逻辑来实现,不在受限于DSP资源,可以大大提高算力。将浮点转化为二值有两种方式,一种是设定阈值,超过阈值设为1,小于设为-1。即:

其中概率为: 随机rounding不会导致参数分布发生偏移。 1)  log量化 在一个2为底的对数表达中,参数被量化为一个2的幂次数据和尺度数。对数表达可以通过少量的bit位数涵盖宽阔的数据范围。比如3bit数据,最大为8,用2的幂次表达可以涵盖从0到255个数据范围。使用了log表达的乘法就可以用移位操作来实现了,这大大节省了DSP的使用。 量化的方式主要分为两种:一种是训练后量化,一种是在训练过程中量化。训练后量化省去了重新量化,但是可能对精度造成较大损失。训练过程量化,是在进行前向网络计算的时候,使用量化参数,而在反向传播过程中存储了浮点参数,更新浮点参数。过程如下: 减少权重的方法也有很多,比如剪枝和结构化参数。剪枝是去除不重要的神经元连接,大大减少了权重数据,而结构化参数是通过设定阈值,让某一块的参数集体为0,这样降低了参数存储和计算量。这两种方法的详细介绍请见公众号之前的文章《剪枝》。

3、FPGA中并行方法

CNN中可以进行并行化运算的结构有:输入通道,输出通道,图像卷积。这其中输出通道之间是没有依赖关系的,而输入通道的结果是需要求和的。图像卷积每行输出像素之间没有依赖关系,但是每个结果像素是对应原来图像多个像素的。即一个卷积核涵盖大小的像素和对应卷积核相乘后累加。 神经网络中输入输出通道数量通常都较大,从输入输出通道上并行是一个很好的加速方法。比如我们选择4个输入通道和4个输出通道,如图3.1所示。


  图3.1 输入输出通道并行化 这样就可以同时并行4x4个卷积运算,对于一个网络层为16(输入通道)x16(输出通道)的卷积运算,应用上述结构,就可以这样拆分来运算(图3.2):每次都完成4x4通道运算,因为有16个输入通道,进行4次这样的运算,就可以输出4个输出通道数据。以同样方法进行4次就实现了16x16网络层的卷积运算。 因为输入通道之间需要求和运算,所以使用了加法树。随着输入通道变大,加法树级数会变深。假设使用2输入加法模块,那么上述4通道结构的加法树级数就是2。在进行FPGA设计的时候这是一个需要考虑的问题,输入通道越多,加法树的fan-in越大,那么在高速时钟情况下,不同路径时间的延时就会影响时序性能了。如果输出通道变大,那么feature map数据的扇出就会变大,因为同一个feature map是被所有输出通道共享的。


图3.2 通过4次4x4运算,然后求和完成4输出通道数据 输入输出通道的并行数收到了网络层大小以及fan-in和fan-out的限制,不可能太大。所以要增加并行度还需要继续探索图像卷积。首先我们想到卷积不是多个像素和卷积核进行乘法嘛,那么我们也将这些乘法并行起来就可以啦。但是这样存在一个问题就是:卷积核大小是不固定的,比如3x3卷积核中9个乘法被同时执行,那么等到了1x1卷积核,就会只有1个乘法器被使用,降低了乘法器利用率。因此这样并行不灵活。并行运算最好找到不存在依赖关系的运算。每行像素的输出是并行的,没有依赖关系的。那么就可以同时进行多行的卷积运算,而一个卷积核内的乘法和加法就可以用一个乘法器和累加器来做,这样就能适应不同卷积核大小的运算。多行并行运算如图3.3。

图3.3 3行卷积并行运算

采用以上输入输出通道的架构,缺点就是fan-out和fan-in较大,加法树级数较大。有没有什么方法可以降低fan-in和fan-out呢?如果将输入通道的求和也使用累加来实现,那就变成只有一个PE完成卷积运算以及不同通道的求和。但是一个PE却降低了并行度,那么可以想到增加串行的PE数量来增加输入并行度,即演变为一列PE来实现输入通道求和。由于PE排序上的空间限制,导致后边一个PE的计算相比于前一个PE要有1个周期延时,如果将数据从从PE间的移动打一拍,那正好可以在第二个PE计算出来的同时完成和前一个PE的求和,这就是脉动的关键所在。更具体的脉动阵列讲解请看公众号之前文章《脉动阵列》。

图3.4 加法树转化为脉动结构

4、存储结构

即使经过了量化和剪枝等处理,网络的参数也非常大(如表4.1),这在有限的FPGA资源下是无法全部存储于片上的。因此需要一个片外存储器(DDR)来存储权重和信息数据,在需要数据的时候从片外搬上片上来进行计算,并将结果存储到片外存储器

表4.1 几种网络压缩前和压缩后大小对比


表4.2 几种Xilinx器件存储资源


这时候影响网络推理延时的因素就不仅仅包含算力的大小了,还需要考虑片上存储大小,ddr带宽,权重和信息数据复用率的影响。带宽和算力对推理延时的综合作用可以通过roofline图来表示。所谓“Roof-line”,指的就是由计算平台的算力和带宽上限这两个参数所决定的“屋顶”形态。Roofline的纵坐标表示算力,屋顶代表了FPGA所能达到的最大算力,横坐标表示每byte数据可以参与多少次运算,表示了权重和信息数据的复用率。由roofline划分出两个瓶颈区域,一个是算力瓶颈,一个是带宽瓶颈。当权重和数据复用率较高,即I大于FPGA所能达到的最大算力对应的复用率的时候,FPGA算力就是瓶颈,但是这种情况是好事情,因为FPGA的运算资源达到了100%的利用。如果数据复用率较低的时候,那么带宽就成为瓶颈,因为在当前带宽下,载入到片上的数据无法支持最大算力,这时候FPGA运算资源利用率没有被全部利用,存在等待数据情形。


图4.1 roofline图 在一个CNN中,网络越往后图像大小越小,输入输出通道数量变大,这导致的结果就是权重参数的复用率变低,这个时候FPGA计算资源利用率就会降低。这个时候带宽大小以及片上存储就成为瓶颈。考虑片上存储后,通过一个简单模型来分析FPGA计算资源利用率。容易知道数据量和复用率同总计算量的关系: 其中D为数据量,I为数据复用率。那么FPGA运算资源自用率就可以表示为:

5、指令

指令实际上是一些控制FPGA流程的信息,比如载入多少数据,进行哪些运算(conv,pool等)。这些控制信息会根据不同的网络结构编辑好,存储成二进制文件放到ddr中。通过FPGA读入来控制操作。这些指令大体上包括以下几种:

1)load weights/image:从ddr中加载权重或者image数据到片上来。这其中会包含ddr首地址,需要读入的数据长度等信息。

2)conv:这个主要进行卷积运算,包括卷积核大小,图像大小,输入输出通道等信息。

3)activate:激活函数的控制,控制是否进行激活操作。

4)save image:将运算完的结果存储到ddr中,包括ddr地址,长度等信息。

总结

FPGA的灵活可配置结构非常适合不断变化的网络结构,同时其并行化和pipeline优势可以用于神经网络的加速。在进行FPGA设计的时候,需要考虑到并行化方式,存储结构,如何平衡带宽和算力之间的关系。

原文标题:在DNN中FPGA做了什么?

文章出处:【微信号:FPGA-EETrend,微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

基于计算机视觉和机器学习的智能马桶

英国《自然·生物医学工程》杂志发表一项最新研究,科学家综合了计算机视觉以及机器学习算法,报告了一套可....
的头像 汽车玩家 发表于 04-08 17:05 108次 阅读
基于计算机视觉和机器学习的智能马桶

产业智能化如何利用人工智能来守护

AI算法本身存在安全漏洞。因为各类机器学习的高度复杂,带来的“黑箱问题”使得算法不可解释。
发表于 04-08 14:26 22次 阅读
产业智能化如何利用人工智能来守护

机器学习的知识产权问题

要构建用于维护的机器学习(ML)模型,必须收集并标记正确的训练集,选择正确的架构和训练参数以实现算法....
发表于 04-08 11:19 53次 阅读
机器学习的知识产权问题

使用Artix-7 FPGA设计电路板,其中电源轨的斜率小于200usec

我有一个使用Artix-7 FPGA(不使用GPT接口)的电路板设计,其中VCCINT,VCCBRAM和MGTAVCC电压轨连接...
发表于 04-08 10:05 13次 阅读
使用Artix-7 FPGA设计电路板,其中电源轨的斜率小于200usec

Virtex 4控制sram的问题

嗨, 使用SRAM读取数据时遇到问题,SRAM通过EMIFA接口连接到FPGA。 FPGA和DSP通过EMIFA连接,S...
发表于 04-08 09:48 14次 阅读
Virtex 4控制sram的问题

利用FPGA作为接口芯片实现DSP到SDRAM的数据存取

在DSP应用系统中,需要大量外扩存储器的情况经常遇到。例如,在数码相机和摄像机中,为了将现场拍摄的诸....
发表于 04-08 09:26 45次 阅读
利用FPGA作为接口芯片实现DSP到SDRAM的数据存取

2020你得知道的物联网趋势

随着技术的不断发展,对于个人和组织而言,利用物联网设备来提高生产力和盈利能力至关重要。
发表于 04-08 09:22 462次 阅读
2020你得知道的物联网趋势

基于SoPC的嵌入式软硬件协同设计性能怎么优化?

软硬件协同设计(Hardware/Software Co-deaign)是在20世纪90年代兴起的跨领域交叉学科。随着超大规模集成电路制造工艺的进步,...
发表于 04-08 08:03 30次 阅读
基于SoPC的嵌入式软硬件协同设计性能怎么优化?

谷歌将利用机器学习技术来改善Duo的通话质量

外媒报道称,为保障 Duo 通话服务在不稳定连接状态下的音频质量,谷歌推出了一项名叫 WaveNet....
的头像 独爱72H 发表于 04-07 21:26 311次 阅读
谷歌将利用机器学习技术来改善Duo的通话质量

什么样的金融智能化监控比较适合我们

随着安防智能化的普及应用,客户对于什么是安防智能化有了更加客观的认知,智能化不是无所不能,更加便捷、....
发表于 04-07 17:16 30次 阅读
什么样的金融智能化监控比较适合我们

机器学习KNN介绍

机器学习(李航统计学方法)之KNN
发表于 04-07 16:20 25次 阅读
机器学习KNN介绍

fpga与dsp通过emif传输问题

[tr]我现在用fpga生成一组信号,然后通过emif传输给dsp。开发板的例程是通过emif收发,我就把dsp端程序的发的部分删掉,然后改fp...
发表于 04-07 16:01 25次 阅读
fpga与dsp通过emif传输问题

利用机器学习算法预测电池的健康状况和安全性能

预测锂离子电池的健康状况和剩余使用寿命是限制电动汽车广泛使用的一大难题。随着时间的推移,电池性能会通....
的头像 牵手一起梦 发表于 04-07 15:37 128次 阅读
利用机器学习算法预测电池的健康状况和安全性能

2025年全球智能城市AI软件市场将增至到49亿美元

分析师机构Omdia的最新分析显示,全球智能城市人工智能(AI)软件市场将从2019年的6.738亿....
的头像 牵手一起梦 发表于 04-07 15:26 169次 阅读
2025年全球智能城市AI软件市场将增至到49亿美元

NXP边缘处理器是如何保证公共安全的

机器学习有各种各样的应用,然而,很少有像公共安全那样引人注目。
发表于 04-07 14:59 66次 阅读
NXP边缘处理器是如何保证公共安全的

Chipscope问题

你好, 我正在使用Aurora 8B / 10B v5.3 IP内核,Virtex 5 FPGA用于使用SFP电缆的GB收发器。 我使用核心生成器...
发表于 04-07 14:52 19次 阅读
Chipscope问题

Spartan 6 FPGA SP605/ISE开发套件的许可证文件

我已经安装了ISE软件(ISE Navigator 13.4)。 我有一张随SP650开发套件一起提供的凭证,设备已锁定在XC6SLX45T...
发表于 04-07 14:52 15次 阅读
Spartan 6 FPGA SP605/ISE开发套件的许可证文件

高云半导体的蓝牙FPGA模组获得欧盟CE认证

无线IC通常由半导体制造商以两种形式提供。一些开发人员需要将蓝牙芯片集成到他们自己的系统电路板上。
发表于 04-07 14:51 53次 阅读
高云半导体的蓝牙FPGA模组获得欧盟CE认证

如何将机器人集成到工作环境中去

在与大众汽车股份公司的联合项目中,HHI的弗劳恩霍夫电信研究所和Heinrich Hertz研究所展....
发表于 04-07 14:34 28次 阅读
如何将机器人集成到工作环境中去

virtex-6 FPGA构建PCB板需要什么?

您好 我希望你做得好 公司为virtex-6 FPGA构建PCB板需要什么? BR...
发表于 04-07 14:22 16次 阅读
virtex-6 FPGA构建PCB板需要什么?

新型传感器技术是如何检测肺癌早期的

早期发现对肺癌非常重要,因为能够在肿瘤扩散到体内较远位置之前被发现的患者,其五年存活率至少会高出六倍....
发表于 04-07 14:15 47次 阅读
新型传感器技术是如何检测肺癌早期的

可以将XCF128XFTG64用于此FPGA吗?

你好 我想用Kintex-7 FPGA(XC7K160T)设计定制电路板。 我有一个关于配置的问题。 我可以将XCF128XFTG64用于...
发表于 04-07 12:10 8次 阅读
可以将XCF128XFTG64用于此FPGA吗?

怎么在小型闪存上保存并读取图像

嗨;我想在紧凑型闪存中保存图像,我想从这个小型闪存中读取此图像以显示在显示器上,我使用FPGA spartan 3400a进行dsp但我不...
发表于 04-07 12:09 10次 阅读
怎么在小型闪存上保存并读取图像

FPGA是什么,关于FPGA原理和特点的分析

FPGA(Field-Programmable Gate Array),即现场可编程门阵列,它是在P....
发表于 04-07 11:41 126次 阅读
FPGA是什么,关于FPGA原理和特点的分析

AI 前沿理论成果转化的速度怎样加快

人工智能已成为国际学术的新热点,经济发展的新引擎和城市建设的新机遇,世界各国争相将其作为未来经济社会....
发表于 04-07 10:51 114次 阅读
AI 前沿理论成果转化的速度怎样加快

机器学习会如何让应用程序变得更加容易

该工具包的目标是研究人员,它将使处理量子数据变得更容易,无论是对自然世界建模,还是对加密量子密钥分发....
发表于 04-07 10:44 34次 阅读
机器学习会如何让应用程序变得更加容易

人工智能遇到神经科学会有什么故事发生

与人脑一样,机器学习神经网络也由相互连接的神经元组成。当一个神经元接收到输入时,它就会激活,并将信息....
发表于 04-07 10:25 24次 阅读
人工智能遇到神经科学会有什么故事发生

FPGA的配置引脚说明

FPGA是基于SRAM编程的,编程信息在系统掉电时会丢失,每次上电时,都需要从器件外部的FLASH或....
发表于 04-07 08:00 14次 阅读
FPGA的配置引脚说明

用于YouTube推荐的深层神经网络

YouTube是现存规模最大、最复杂的行业推荐系统之一。在本文中,我们对系统进行了高层次的描述,并着....
发表于 04-07 08:00 12次 阅读
用于YouTube推荐的深层神经网络

机器学习适合云计算运维吗

为云计算服务团队提供机器学习功能的系统不仅是一个错误,而且也是危险的。
发表于 04-06 22:58 25次 阅读
机器学习适合云计算运维吗

你对于AI存在恐惧吗

人工智能一直是计算技术发展的梦想,它总是遥不可及。
发表于 04-06 22:07 43次 阅读
你对于AI存在恐惧吗

机器学习与预测分析存在什么差异

AI是刺激商业发展的一颗新星,取代了以往的资本和劳动力的投入。
发表于 04-06 21:56 40次 阅读
机器学习与预测分析存在什么差异

如何使用代码了解数学符号

当我们用自己喜欢的语言查看求和,阶乘,矩阵等时,它们很简单
的头像 Wildesbeast 发表于 04-06 12:09 93次 阅读
如何使用代码了解数学符号

AI驱动的网络安全团队可以带来什么益处

AI是机器学习算法和相关技术的总称,这些技术可以扩展威胁分析和分类、更好地了解异常情况、自动响应,并....
发表于 04-05 23:10 10次 阅读
AI驱动的网络安全团队可以带来什么益处

机器学习翻译存在什么局限

机器学习为企业提供了翻译文档的新机会,他们可以使用机器学习来翻译营销材料和其他文献。
发表于 04-05 22:16 203次 阅读
机器学习翻译存在什么局限

数据转换率较低对于机器学习有什么影响

营销人员可以采用多种策略来使用机器学习算法来优化广告并进行推广。但是,其中一些策略的局限性要比营销人....
发表于 04-05 22:13 168次 阅读
数据转换率较低对于机器学习有什么影响

人工智能对于销售行业有什么影响

人工智能和机器学习现在很容易采用,并且人们也知道可以使现在执行的许多重复性任务和过程实现自动化。
发表于 04-05 21:57 63次 阅读
人工智能对于销售行业有什么影响

机器学习可以准确的预测股市?

机器学习是一种数据分析技术,它可以借鉴使用计算数据的经验,直接从数据中“学习”信息,而无需依赖预先确....
发表于 04-05 21:53 154次 阅读
机器学习可以准确的预测股市?

统计学对于机器学习有什么作用

统计学和机器学习是两个密切相关的领域。实际上,两者之间的界限有时可能非常模糊。
发表于 04-05 21:51 24次 阅读
统计学对于机器学习有什么作用

人工智能数据存储的选择有哪些准则

企业选择错误的人工智能存储平台可能会产生严重影响。因此,人们需要了解可能影响企业选择人工智能数据存储....
发表于 04-05 21:27 167次 阅读
人工智能数据存储的选择有哪些准则

大规模存储基础设施对于AI有着怎样的要求

人工智能/机器学习环境创建使用内部或直接连接存储(DAS)的计算服务器集群的情况并不少见。
发表于 04-05 21:23 156次 阅读
大规模存储基础设施对于AI有着怎样的要求

机器设计会受到AI技术的影响吗

人工智能如今应用越来越广泛。在大多数情况下,健壮和自适应的人工智能可以为人类的专业知识提供补充,而不....
发表于 04-05 21:09 29次 阅读
机器设计会受到AI技术的影响吗

采用WISHBONE总线有效地解决IP核可移植性、设计复用问题

清华大学嵌入式微处理器芯片设计为国家重点863项目,单芯片多处理器设计为项目的一个延伸。单芯片多处理....
发表于 04-04 18:19 52次 阅读
采用WISHBONE总线有效地解决IP核可移植性、设计复用问题

ADC12QS065里用LVDS格式解决输出信号传输问题

在输入信号转换数字数据之后,必须传输它们到DSP或ASIC/FPGA进行处理。流行的全差分输出信号传....
发表于 04-04 17:43 12次 阅读
ADC12QS065里用LVDS格式解决输出信号传输问题

谷歌Art Transfer工具将照片转换

随着机器学习和人工智能技术的发展,搜索巨头谷歌已经将自家研究成果应用于方方面面。比如近日推出的一款名....
的头像 汽车玩家 发表于 04-03 15:55 344次 阅读
谷歌Art Transfer工具将照片转换

一款利用人工智能和物联网来帮助老年人和他们的看护者的产品

凯伦·罗比:机器学习,人工智能——我们在TechRepublic和ZDNet上谈论了很多这方面的内容....
的头像 倩倩 发表于 04-03 15:01 329次 阅读
一款利用人工智能和物联网来帮助老年人和他们的看护者的产品

一项关于可解释人工智能规划(XAIP)的工作调查

可解释AI(X AI)近年来一直是一个积极的研究课题,受到DARPA2016年倡议的推动。 计算机视....
的头像 倩倩 发表于 04-03 14:57 274次 阅读
一项关于可解释人工智能规划(XAIP)的工作调查

KiloGram是一种用于管理文件中的大型n-gram的新算法

在KDD 2019网络安全学习和采矿研讨会上发表的论文中,来自马里兰大学和网络安全公司Endgame....
的头像 倩倩 发表于 04-03 14:55 223次 阅读
KiloGram是一种用于管理文件中的大型n-gram的新算法

人工智能正在改变我们与技术互动的方式

对客户体验的期望已经改变,并且对于这种改变越来越重要的一个因素是机器学习。我们经常使用的大多数数字产....
的头像 倩倩 发表于 04-03 14:54 244次 阅读
人工智能正在改变我们与技术互动的方式

ICMEC与AWS一起创建了一个集中式平台

夏皮罗回忆说:“她说要从事这项工作,每天都要这样做,你会放弃自己的一点纯真,以保留他人的纯真。” “....
的头像 倩倩 发表于 04-03 14:46 293次 阅读
ICMEC与AWS一起创建了一个集中式平台

Google推出AI平台-构建运行和管理ML项目的端到端平台

AI平台是您进行此恐怖旅程的地方,它源于一个想法,即如何通过启动安全,可靠的部署在企业中一直使用AI....
的头像 倩倩 发表于 04-03 14:44 388次 阅读
Google推出AI平台-构建运行和管理ML项目的端到端平台

人工智能上存在什么分歧

人工智能一再言过其实,却未能兑现其承诺。
发表于 04-03 14:41 18次 阅读
人工智能上存在什么分歧

Google宣布了一项新的beta机器学习服务,称为文档理解AI

Gartner和福布斯估计,80%的企业数据是非结构化的,而70%的企业数据是自由格式的文本,例如电....
的头像 倩倩 发表于 04-03 14:39 219次 阅读
Google宣布了一项新的beta机器学习服务,称为文档理解AI

新人工智能技术的大规模商业化应用将会如何影响全球经济发展

新人工智能技术作为新一代信息技术,具有渗透性、替代性、协同性、创造性等技术—经济特征。这些特征使得新....
发表于 04-03 10:56 64次 阅读
新人工智能技术的大规模商业化应用将会如何影响全球经济发展

谷歌拟使用机器学习技术改善Duo通话服务的音质

外媒报道称,为保障 Duo 通话服务在不稳定连接状态下的音频质量,谷歌推出了一项名叫 WaveNet....
发表于 04-03 10:29 34次 阅读
谷歌拟使用机器学习技术改善Duo通话服务的音质

东京大学和索尼共同研发出AI系统“Derma” 可实现从口形到语音的转化

不出声,仅仅通过喉咙和下颚的皮肤震动就能知道你想说什么。这可不是读唇术,更不是在拍特工电影。
发表于 04-03 09:08 49次 阅读
东京大学和索尼共同研发出AI系统“Derma” 可实现从口形到语音的转化

机器学习对于物联网来说意味着什么

机器学习不仅仅是由企业或创新者所使用,它也用于安全目的,目前已有机器学习算法正在应对网络威胁。
发表于 04-03 08:58 65次 阅读
机器学习对于物联网来说意味着什么

TMP411 ±1°C Programmable Remote/Local Digital Out Temperature Sensor

TMP411设备是一个带有内置本地温度传感器的远程温度传感器监视器。远程温度传感器,二极管连接的晶体管通常是低成本,NPN或PNP型晶体管或二极管,是微控制器,微处理器或FPGA的组成部分。 远程精度为±1 °C适用于多个设备制造商,无需校准。双线串行接口接受SMBus写字节,读字节,发送字节和接收字节命令,以设置报警阈值和读取温度数据。 TMP411器件中包含的功能包括:串联电阻取消,可编程非理想因子,可编程分辨率,可编程阈值限制,用户定义的偏移寄存器,用于最大精度,最小和最大温度监视器,宽远程温度测量范围(高达150°C),二极管故障检测和温度警报功能。 TMP411器件采用VSSOP-8和SOIC-8封装。 特性 ±1°C远程二极管传感器 ±1°C本地温度传感器 可编程非理想因素 串联电阻取消 警报功能 系统校准的偏移寄存器 与ADT7461和ADM1032兼容的引脚和寄存器 可编程分辨率:9至12位 可编程阈值限...
发表于 09-19 16:35 153次 阅读
TMP411 ±1°C Programmable Remote/Local Digital Out Temperature Sensor

TMP468 具有引脚可编程的总线地址的高精度远程和本地温度传感器

TMP468器件是一款使用双线制SMBus或I 2 C兼容接口的多区域高精度低功耗温度传感器。除了本地温度外,还可以同时监控多达八个连接远程二极管的温度区域。聚合系统中的温度测量可通过缩小保护频带提升性能,并且可以降低电路板复杂程度。典型用例为监测服务器和电信设备等复杂系统中不同处理器(如MCU,GPU和FPGA)的温度。该器件将诸如串联电阻抵消,可编程非理想性因子,可编程偏移和可编程温度限值等高级特性完美结合,提供了一套精度和抗扰度更高且稳健耐用的温度监控解决方案。 八个远程通道(以及本地通道)均可独立编程,设定两个在测量位置的相应温度超出对应值时触发的阈值。此外,还可通过可编程迟滞设置避免阈值持续切换。 TMP468器件可提供高测量精度(0.75°C)和测量分辨率(0.0 625°C)。该器件还支持低电压轨(1.7V至3.6V)和通用双线制接口,采用高空间利用率的小型封装(3mm×3mm或1.6mm×1.6mm),可在计算系统中轻松集成。远程结支持-55°C至+ 150°C的温度范围。 特性 8通道远程二极管温度传感器精度:±0.75&...
发表于 09-18 16:05 104次 阅读
TMP468 具有引脚可编程的总线地址的高精度远程和本地温度传感器