电子发烧友网 > 可编程逻辑 > 正文

一种递归神经网络在FPGA平台上的实现方案详解

2018年09月12日 16:53 次阅读

近十年来,人工智能又到了一个快速发展的阶段。深度学习在其发展中起到了中流砥柱的作用,尽管拥有强大的模拟预测能力,深度学习还面临着超大计算量的问题。在硬件层面上,GPUASIC,FPGA都是解决庞大计算量的方案。本文将阐释深度学习和FPGA各自的结构特点以及为什么用FPGA加速深度学习是有效的,并且将介绍一种递归神经网络(RNN)在FPGA平台上的实现方案。

揭开深度学习的面纱

深度学习是机器学习的一个领域,都属于人工智能的范畴。深度学习主要研究的是人工神经网络的算法、理论、应用。自从2006年Hinton等人提出来之后,深度学习高速发展,在自然语言处理、图像处理、语音处理等领域都取得了非凡的成就,受到了巨大的关注。在互联网概念被人们普遍关注的时代,深度学习给人工智能带来的影响是巨大的,人们会为它隐含的巨大潜能以及广泛的应用价值感到不可思议。

事实上,人工智能是上世纪就提出来的概念。1957年,Rosenblatt提出了感知机模型(Perception),即两层的线性网络;1986年,Rumelhart等人提出了后向传播算法(Back PropagaTIon),用于三层的神经网络的训练,使得训练优化参数庞大的神经网络成为可能;1995年,Vapnik等人发明了支持向量机(Support Vector Machines),在分类问题中展现了其强大的能力。以上都是人工智能历史上比较有代表性的事件,然而受限于当时计算能力,AI总是在一段高光之后便要陷入灰暗时光——称为:“AI寒冬”。

然而,随着计算机硬件能力和存储能力的提升,加上庞大的数据集,现在正是人AI发展的最好时机。自Hinton提出DBN(深度置信网络)以来,人工智能就在不断的高速发展。在图像处理领域,CNN(卷积神经网络)发挥了不可替代的作用,在语音识别领域,RNN(递归神经网络)也表现的可圈可点。而科技巨头也在加紧自己的脚步,谷歌的领军人物是Hinton,其重头戏是Google brain,并且在去年还收购了利用AI在游戏中击败人类的DeepMind;Facebook的领军人物是Yann LeCun,另外还组建了Facebook的AI实验室,Deepface在人脸识别的准确率更达到了惊人的97.35%;而国内的巨头当属百度,在挖来了斯坦福大学教授Andrew Ng(Coursera的联合创始人)并成立了百度大脑项目之后,百度在语音识别领域的表现一直十分强势。

一览深度学习

简单来说,深度学习与传统的机器学习算法的分类是一致的,主要分为监督学习(supervised learning)和非监督学习(unsupervised learning)。所谓监督学习,就是输出是有标记的学习,让模型通过训练,迭代收敛到目标值;而非监督学习不需要人为输入标签,模型通过学习发现数据的结构特征。比较常见的监督学习方法有逻辑回归、多层感知机、卷积神经网络登;而非监督学习主要有稀疏编码器、受限玻尔兹曼机、深度置信网络等。所有的这些都是通过神经网络来实现的,他们通常来说都是非常复杂的结构,需要学习的参数也非常多。但是神经网络也可以做简单的事情,比如XNOR门,如图。

一种递归神经网络在FPGA平台上的实现方案详解

在图1(a)中,两个输入x_1和x_2都是分别由一个神经元表示,在输入中还加入了一个作为偏置(bias)的神经元,通过训练学习参数,最终整个模型的参数收敛,功能和图1(b)真值表一模一样。图1(c)分类结果。

而通常来说,模型都是比较复杂的。比如ILSVRC2012年图像识别大赛中Krizhevsky等人构建出来的 Alex Net。他们一共构建了11层的神经网络(5个卷积层,3个全连接层,3个池化层),一共有65万个神经元,6千万个参数,最终达到了15.2%的识别错误率,大大领先于第二名的26.2%。

一种递归神经网络在FPGA平台上的实现方案详解

当前深度学习得以流行,是得益于大数据和计算性能的提升。但其仍然遭受计算能力和数据量的瓶颈。针对数据量的需求,专家们可以通过模型的调整、变更来缓解,但计算力的挑战没有捷径。科大讯飞、百度、阿里、360在深度学习方面也面临着计算力的困扰。科大讯飞的深度学习平台属于计算密集型的平台,集群几百台机器之间要实现高速互联,是类似超算的结构,但它又不是一个非常典型的超算。科大讯飞最开始探索传统的方式,用大量CPU来支持大规模数据预处理,运行GMM-HMM等经典模型的训练,在千小时的数据量下,效果很不好。而360每天处理的数据有上亿条,参数50万以上,如果用CPU,每次模型训练就要花几天,这对于崇尚快速迭代的互联网公司运营来说简直是不可接受的。

为什么选择FPGA

FPGA(Field Programmable Gate Array)是在PAL、GAL、CPLD等可编程逻辑器件的基础上进一步发展的产物。它是作为专用集成电路领域中的一种半定制电路而出现的,既解决了全定制电路的不足,又克服了原有可编程逻辑器件门电路数有限的缺点。FPGA的开发相对于传统PC、单片机的开发有很大不同。FPGA以并行运算为主,以硬件描述语言来实现;相比于PC或单片机(无论是冯诺依曼结构还是哈佛结构)的顺序操作有很大区别。FPGA开发需要从顶层设计、模块分层、逻辑实现、软硬件调试等多方面着手。FPGA可以通过烧写位流文件对其进行反复编程,目前,绝大多数 FPGA 都采用基于 SRAM(StaTIc Random Access Memory 静态随机存储器)工艺的查找表结构,通过烧写位流文件改变查找表内容实现配置。

下面讨论几种可实现深度学习算法的硬件。

使用CPU。在2006年的时候,人们还是用串行处理器处理机器学习的问题,当时Mutch 和 Lowe开发了一个工具FHLib(feature hierarchy library)用来处理hierarchical 模型。对于CPU来说,它所要求的编程量是比较少的并且有可迁移性的好处,但是串行处理的特点变成了它在深度学习领域的缺点,而这个缺点是致命的。时至今日,据2006年已经过去了十年,过去的十年集成电路的发展还是遵循着摩尔定律,CPU的性能得到了极大的提升,然而,这并没有让CPU再次走入深度学习研究者的视野。尽管在小数据集上CPU能有一定的计算能力表现,多核使得它能够并行处理,然而这对深度学习来说还是远远不够的。

使用GPU。GPU走进了研究者的视线,相比于CPU,GPU的核心数大大提高了,这也让它有更强大的并行处理能力,它还有更加强大的控制数据流和储存数据的能力。Chikkerur进行了CPU和GPU在处理目标识别能力上的差别,最终GPU的处理速度是CPU的3-10倍。

使用ASIC。专用集成电路芯片(ASIC)由于其定制化的特点,是一种比GPU更高效的方法。但是其定制化也决定了它的可迁移性低,一旦专用于一个设计好的系统中,要迁移到其它的系统是不可能的。并且,其造价高昂,生产周期长,使得它在目前的研究中是不被考虑的。当然,其优越的性能还是能在一些领域胜任。用的就是ASIC 的方案,在640×480pixel的图像中识别速率能达到 60帧/秒。

使用FPGA。FPGA在GPU和ASIC中取得了权衡,很好的兼顾了处理速度和控制能力。一方面,FPGA是可编程重构的硬件,因此相比GPU有更强大的可调控能力;另一方面,与日增长的门资源和内存带宽使得它有更大的设计空间。更方便的是,FPGA还省去了ASIC方案中所需要的流片过程。FPGA的一个缺点是其要求使用者能使用硬件描述语言对其进行编程。但是,已经有科技公司和研究机构开发了更加容易使用的语言比如Impulse Accelerated Technologies Inc. 开发了C-to-FPGA编译器使得FPGA更加贴合用户的使用,耶鲁的E-Lab 开发了Lua脚本语言。这些工具在一定程度上缩短了研究者的开发时限,使研究更加简单易行。

在FPGA上运行LSTM神经网络

LSTM简介

传统的RNN由一个三层的网络:输入层it,隐藏层ht,输出层yt;其中ht的信息作用到下一时刻的输入,这样的结构简单的模仿了人脑的记忆功能,图3是其拓扑图:

一种递归神经网络在FPGA平台上的实现方案详解

只有一个隐藏层方程:

其中 Wx和 Wh分别是输入和隐藏层的权重,b 是偏置。

LSTM 是RNN(递归神经网络)的一种,在处理时序数据得到了最广泛的应用,它由门控制信息一共有三个个门:输入门it,遗忘门ft,输出门ot,另外还有隐藏层ht和记忆细胞ct。图4是其拓扑图:

一种递归神经网络在FPGA平台上的实现方案详解

输入门控制了某一时刻的输入;遗忘门通过作用到上一时刻记忆细胞上,控制了上一时刻的数据流要流多少进入下一时刻;记忆细胞是由上一时刻的输入和这一时刻的候选输入共同决定的;输出门作用到记忆细胞上,决定了这一时刻的隐藏层信息,并且送到下一层神经网络上。全部方程如下:

一种递归神经网络在FPGA平台上的实现方案详解

其中W 代表各自的权重,b 代表各自的偏置, σ 是logisTIc sigmoid 函数:

设计FPGA模块

研究使用的FPGA是Xilinx的Zedboard Zynq ZC7020板子。图5是它的概览

一种递归神经网络在FPGA平台上的实现方案详解

LSTM主要进行的是矩阵的乘法和非线性函数的计算(tanh,sigmoid),因此,选择了Q8.8定点。

矩阵乘法由MAC单元进行(MulTIply Accumulate),一共有两个数据流:向量和权重矩阵流,如图6(a)。在迭代完一次之后MAC就会重置以防止之前的数据混入下一时刻的数据。两个MAC单元的数据相加之后进行非线性函数计算。同时用一个rescale模块将32位的数据转变为16位的数据。

标量计算的模块,是为了计算ct和ht,最终传入下一时刻的计算。如图6(b)。

整个模型一共用了三个图6(a)和一个图6(b)的模块,如图6(c)。数据的流入流出用了DMA(Direct Memory Access)串口控制。由于DMA串口是独立的,因此,还需要一个时钟模块对其进行时序控制。时钟模块主要是一个缓冲存储器组成并暂存了一些数据直到数据都到达。当最后的一个端口数据流入时钟模块才开始传送数据,这保证了输入跟权重矩阵是同个时刻相关的。

一种递归神经网络在FPGA平台上的实现方案详解

因此,LSTM模型的运算分为三个阶段:

一种递归神经网络在FPGA平台上的实现方案详解

结果分析

通过在不同平台上训练LSTM网络,我们得到了不同模型的对比。表1是平台的参数,运行结果如图7,可以发现:即使在142MHz的时钟频率下,FPGA平台下的运行时间远远小于其他平台,并行八个LSTM 记忆细胞的处理取得了比 Exynos5422 快16倍的结果。

一种递归神经网络在FPGA平台上的实现方案详解

未来展望

深度学习采用包含多个隐藏层的深层神经网络(DeepNeural Networks,DNN)模型。DNN内在的并行性,使得具备大规模并行体系结构的GPU和FPGA成为加速深度学习的主流硬件平台,其突出优势是能够根据应用的特征来定制计算和存储结构,达到硬件结构与深度学习算法的最优匹配,获得更高的性能功耗比;并且,FPGA灵活的重构功能也方便了算法的微调和优化,能够大大缩短开发周期。毫无疑问,FPGA在深度学习的未来是十分值得期待的。

技术专区

关注电子发烧友微信

有趣有料的资讯及技术干货

下载发烧友APP

打造属于您的人脉电子圈

关注发烧友课堂

锁定最新课程活动及技术直播
收藏 人收藏
分享:

评论

相关推荐

国家必须坚决支持自主FPGA技术发展

日前关于京微雅格的风波引起了业内的广泛关注,无论争论结果如何,需要明确的一点是国家必须坚决支持自主F...

发表于 2018-09-12 17:03 0次阅读
国家必须坚决支持自主FPGA技术发展

基于Unrolling的深度方法及应用

为了更深刻理解深度网络的本质特点,我们首先比较一下传统模型驱动的思路和端到端学习深度网络建模方法的区...

发表于 2018-09-12 16:14 37次阅读
基于Unrolling的深度方法及应用

N9030A PXA信号分析仪有进一步将信号下变频为DC(0 Hz)的能力吗?

发表于 2018-09-12 15:41 4次阅读
N9030A PXA信号分析仪有进一步将信号下变频为DC(0 Hz)的能力吗?

AI在汽车电子中的应用:如何利用深度学习保证汽车...

在未来的某个时候,人们必定能够相对自如地运用人工智能,安全地驾车出行。这个时刻何时到来我无法预见;但...

发表于 2018-09-12 15:17 99次阅读
AI在汽车电子中的应用:如何利用深度学习保证汽车...

通过YouTube视频中的图像和声音来训练深度神...

该团队在麻省理工学院的计算机科学和人工智能实验室 (Computer Science and Art...

发表于 2018-09-12 14:19 70次阅读
通过YouTube视频中的图像和声音来训练深度神...

能介绍下FPGA开发板么?

发表于 2018-09-12 13:46 11次阅读
能介绍下FPGA开发板么?

四句话就让你彻底明白人工智能都是什么!

强人工智能又称通用人工智能或完全人工智能, 指的是可以胜任人类所有工作的人工智能。一个可以称得上强人...

发表于 2018-09-12 10:39 95次阅读
四句话就让你彻底明白人工智能都是什么!

有没有办法自动将输入到设备输入表单中的组件部件号添加到由IPG测试顾问在备注部分生成的组件测试中?

发表于 2018-09-12 10:19 10次阅读
有没有办法自动将输入到设备输入表单中的组件部件号添加到由IPG测试顾问在备注部分生成的组件测试中?

AD9736的输出50M到550M信号不平坦

发表于 2018-09-12 10:17 8次阅读
AD9736的输出50M到550M信号不平坦

【FPGA】VHDL 语言的运算符有哪些?计算的优先级是怎样的?

发表于 2018-09-12 09:51 34次阅读
【FPGA】VHDL 语言的运算符有哪些?计算的优先级是怎样的?

【FPGA】VHDL 语言的数据对象有哪些?VHDL常量、信号和变量的申明方法

发表于 2018-09-12 09:32 19次阅读
【FPGA】VHDL 语言的数据对象有哪些?VHDL常量、信号和变量的申明方法

Altera Arria V FPGA完整电源解决方案包括BOM及层图

发表于 2018-09-12 09:08 33次阅读
Altera Arria V FPGA完整电源解决方案包括BOM及层图

Xilinx Zynq FPGA电源设计方案包括BOM及层图

发表于 2018-09-12 08:50 33次阅读
Xilinx Zynq FPGA电源设计方案包括BOM及层图

针对FPGA或ASIC部署的浮点算法

发表于 2018-09-11 21:59 112次阅读
针对FPGA或ASIC部署的浮点算法

FPGA配置AD9364怎么操作

发表于 2018-09-11 21:09 4次阅读
FPGA配置AD9364怎么操作

AGM历经艰险成功逆袭,将成为亚洲出货量最大的非...

2015年国内的半导体行业可谓风生水起,国家意志主导的大基金大开大合,紫光为首的国内大佬在国外并购频...

发表于 2018-09-11 17:42 36次阅读
AGM历经艰险成功逆袭,将成为亚洲出货量最大的非...

Altera宣布启动其设计解决方案网路,加速客户...

Altera宣布启动其设计解决方案网路(DSN),此一全球辅助支援系统将稳健的设计服务网路、IP、电...

发表于 2018-09-11 17:36 55次阅读
Altera宣布启动其设计解决方案网路,加速客户...

训练表示学习函数(即编码器)以最大化其输入和输出...

互信息是出了名的难计算,特别是在连续和高维设置中。幸运的是,在神经估计的最新进展中,已经能够有效计算...

发表于 2018-09-11 16:51 155次阅读
训练表示学习函数(即编码器)以最大化其输入和输出...

国产FPGA面临着重重挑战?国产FPGA该如何突...

进入今年,在中兴事件和中美贸易战的双重影响下,国内对集成电路的关注到达了前所未有的高度。而在过去多...

发表于 2018-09-10 17:43 645次阅读
国产FPGA面临着重重挑战?国产FPGA该如何突...

在一片红海的AI芯片市场中,FPGA凭借独特的优...

“AI芯片”这个新鲜的概念在过去一年间逐渐走过了普及的阶段,越来越被大众所熟知。在行业走过野蛮生长...

发表于 2018-09-10 17:18 345次阅读
在一片红海的AI芯片市场中,FPGA凭借独特的优...

盘点人工智能在汽车安全系统的实际应用

深度学习早已不是一个新概念,我们已经可以预见,在未来的未来的汽车与交通中,AI将会得到广泛而深入的应...

发表于 2018-09-10 11:30 505次阅读
盘点人工智能在汽车安全系统的实际应用

MIT不断开发新的方法来分析从仪表化车队收集的大...

在MIT - AVT研究的头14个月里,车辆每天行驶里程的可视化。这种可视化没有显示最近几个月,因为...

发表于 2018-09-10 10:58 390次阅读
MIT不断开发新的方法来分析从仪表化车队收集的大...

一名技术人员的十条精进原则

“以终为始”(Begin With The End In Mind),是史蒂芬·柯维在《高效能人士的...

发表于 2018-09-10 10:05 287次阅读
一名技术人员的十条精进原则

2018年世界计算机研究者单天引用次数排行榜

Yoshua Bengio,CIFAR机器学习项目的联合主任,同时也是蒙特利尔大学计算机与运算系的教...

发表于 2018-09-10 09:27 274次阅读
2018年世界计算机研究者单天引用次数排行榜

日韩汽车产业加速追赶自动驾驶汽车芯片的发展

由于一直以来日韩汽车产业的核心零部件供应链相对封闭,在全球汽车工业掀起自动驾驶浪潮及新一轮的投资背景...

发表于 2018-09-10 08:55 750次阅读
日韩汽车产业加速追赶自动驾驶汽车芯片的发展

超越了数字信号处理器的运算能力

所以简单一句话就是,FPGA处理事情的实时性很高。举个例子,比如你要同时买一瓶水和一袋饼干,ARM的...

发表于 2018-09-10 08:17 652次阅读
超越了数字信号处理器的运算能力

FPGA软件的发展趋势

This talk will discuss the challenge of FPGA devel...

发表于 2018-09-10 04:14 192次阅读
FPGA软件的发展趋势

实现信号CDMA调制/解调的水声通信系统

任何信息需要借助声、光、电信 号进行传递,由于光信号和电信号在海水中的衰减比较严重,而声波是人类迄今...

发表于 2018-09-09 10:53 61次阅读
实现信号CDMA调制/解调的水声通信系统

用光速实现深度学习,探讨光学神经网络的应用

光学人工神经网络直观模拟大脑处理信息的方式,可应用到新的相机设计和光学组件设计中,也可用于医疗技术、...

发表于 2018-09-09 10:28 266次阅读
用光速实现深度学习,探讨光学神经网络的应用

通过深度学习实现自动驾驶之车辆检测

自动驾驶系统怎么感知周围环境并做出“人类”的决定?如何在系统中使用 MATLAB?

发表于 2018-09-09 09:57 354次阅读
通过深度学习实现自动驾驶之车辆检测

大华推出“慧”系列AI出入口抓拍摄像机,让停车不...

随着人工智能技术的飞速发展,“AI”已不再遥不可及,“视频+AI”的技术,已让生活的方方面面,充满可...

发表于 2018-09-09 01:32 38次阅读
大华推出“慧”系列AI出入口抓拍摄像机,让停车不...

Altera为其基于ARM的SoC提供新支持,节...

Altera公司今天宣布,使用MathWorks的业界标准工作流程,为其基于ARM的SoC提供新支...

发表于 2018-09-08 10:04 68次阅读
Altera为其基于ARM的SoC提供新支持,节...

Spansion公司将借助一块FPGA参考板展示...

Spansion公司发布面向Xilinx Zynq-7000All Programmable So...

发表于 2018-09-08 10:03 76次阅读
Spansion公司将借助一块FPGA参考板展示...

新思虚拟原型工具可帮助汽车厂减少80%的自动驾驶...

这时候必须要有一些新的开发测试方法来解决这个问题。幸运的是,业界领先的EDA设计测试工具供应商新思科...

发表于 2018-09-08 09:49 667次阅读
新思虚拟原型工具可帮助汽车厂减少80%的自动驾驶...

机器学习研究项目的常见误区

基于现在这些深度学习库,让模型变得复杂很容易,加上更多的组件、网络层和优化技巧。然而,当你改动代码或...

发表于 2018-09-08 09:18 492次阅读
机器学习研究项目的常见误区

莱迪思半导体任命Steve Douglass为公...

FPGA行业高管引领莱迪思全球研发团队推动产品创新 莱迪思半导体公司(NASDAQ:LSCC),客制...

发表于 2018-09-08 08:47 400次阅读
莱迪思半导体任命Steve Douglass为公...

从技术到品牌,AI如何推动FPGA应用拓展?

近日,全球最大的FPGA厂商赛灵思宣布收购深鉴科技的消息,引发人工智能芯片行业热议,这也是首起中国A...

发表于 2018-09-07 17:03 466次阅读
从技术到品牌,AI如何推动FPGA应用拓展?

美高森美提供了最高密度、最低功耗的SmartFu...

美高森美公司(Microsemi) 宣布提供全新最高密度、最低功耗SmartFusion2 150...

发表于 2018-09-07 15:20 251次阅读
美高森美提供了最高密度、最低功耗的SmartFu...

Kintex UltraScale KU115 ...

赛灵思公司(Xilinx)今天宣布Kintex UltraScale KU115 FPGA器件正式...

发表于 2018-09-07 15:08 97次阅读
Kintex UltraScale KU115 ...

PCIe物理层接口定义了物理层中的,媒介层和物理...

随着高速串行技术的发展,各种串行通信技术的物理层逐渐走向了统一,用户甚至可以基于FPGA中的SerD...

发表于 2018-09-07 11:42 223次阅读
PCIe物理层接口定义了物理层中的,媒介层和物理...

通过深度学习方法为黑白老照片自动上色,带我们重新...

现在,随着数据集的增加,由于我们处理的是高分辨率图像,因此我们需要更多的计算能力。为此,我个人更喜欢...

发表于 2018-09-07 10:13 318次阅读
通过深度学习方法为黑白老照片自动上色,带我们重新...

FPGA设计需要注意哪些要点

FPGA的用处比我们平时想象的用处更广泛,原因在于其中集成的模块种类更多,而不仅仅是原来的简单逻辑单...

发表于 2018-09-07 09:43 827次阅读
FPGA设计需要注意哪些要点

融合以太网和无源光网络(PON)测试仪的FPGA...

本文说明了研究开发EPON测试仪的意义,简要描述了其功能结构,并着重阐述了其硬件平台的FPGA设计与...

发表于 2018-09-07 08:29 634次阅读
融合以太网和无源光网络(PON)测试仪的FPGA...

了解一下适用于每种学习模式的数据集和问题类型

在无监督式学习中,深度学习模型会收到某个数据集,但对于如何处理该数据集却未获得明确的指示。训练数据集...

发表于 2018-09-06 16:15 238次阅读
了解一下适用于每种学习模式的数据集和问题类型

莱迪思MachXO3LTM产品系列开始量产,FP...

莱迪思半导体公司的MachXO3LTM产品系列开始量产,包含最小尺寸为2.5 mm x 2.5 m...

发表于 2018-09-06 16:06 113次阅读
莱迪思MachXO3LTM产品系列开始量产,FP...

李开复:人工智能技术随着深度学习的出现,迎来野蛮...

李开复博士在回答记者提问的时候也专门提到了这一问题,他说:“有关中美的竞争和合作,我真心认为中美的创...

发表于 2018-09-06 10:40 813次阅读
李开复:人工智能技术随着深度学习的出现,迎来野蛮...

基于深度学习的无信标自动追踪工具

通过构建深度网络和数据集,研究人员们成功训练出了一个可以从视频中抽取身体特定部分位置的模型。研究人员...

发表于 2018-09-06 09:06 807次阅读
基于深度学习的无信标自动追踪工具

随着物联网智能化的提升,FPGA将发挥更多的作用

随着物联网智能化的提升和不断迭代,FPGA将发挥更多的数据预处理、桥接、I/O扩展等作用。

发表于 2018-09-05 17:09 478次阅读
随着物联网智能化的提升,FPGA将发挥更多的作用

嵌入式FPGA能随时更改RTL的灵活性,将改变芯...

芯片设计人员今天面临的最关键的问题之一是在设计过程中实时重新配置RTL,甚至在系统中也是如此。不幸的...

发表于 2018-09-05 16:58 111次阅读
嵌入式FPGA能随时更改RTL的灵活性,将改变芯...

FPGA加速今日新型态数据中心的主流应用,支持处...

在这个强调智能与联网的时代,可编程逻辑栅阵列 (FPGA)已经成为一个重要且不可或缺的元件。以全球5...

发表于 2018-09-05 14:09 384次阅读
FPGA加速今日新型态数据中心的主流应用,支持处...

AAltera公司与Mentor Graphic...

这些虚拟平台包括了指令集仿真器CPU模型和外设器件模型,以单独二进制可执行文件的形式提供,可以下载,...

发表于 2018-09-05 10:11 230次阅读
AAltera公司与Mentor Graphic...

机器学习美女博士亲身体验:读博与工作,如何抉择?

事后来看,所有这些都是比我想象的更狭窄的技能的一部分,而且这些技能中的许多都不如我期望的那样具备可迁...

发表于 2018-09-05 08:48 996次阅读
机器学习美女博士亲身体验:读博与工作,如何抉择?

做AI,底层框架or上层应用?

无论你想做深度学习还是深度学习系统,都需要同时了解两方面的知识,根据自己的方向可以有所侧重,但一定不...

发表于 2018-09-05 08:42 371次阅读
做AI,底层框架or上层应用?

深度学习赋能零售行业,聚焦时尚零售及电商数据分析...

随着线上零售所占份额的逐渐增加,线下零售受到了越来越大的市场冲击,故而如何将线上数字化、智能化、个性...

发表于 2018-09-04 17:21 433次阅读
深度学习赋能零售行业,聚焦时尚零售及电商数据分析...

ARKit、3D引擎、深度学习等技术在直播场景下...

随着直播行业的发展,单向的直播已经没有什么新意了,现在大家开始关注连麦、一对一的单聊、群聊等。这些功...

发表于 2018-09-04 16:56 371次阅读
ARKit、3D引擎、深度学习等技术在直播场景下...

以FPGA作为硬件核心部分的自动温度采集控制系统...

随着当前工业控制自动化日益普及,对于工作环境中的温度控制也越来越重要。本设计即是针对某些需要持续恒温...

发表于 2018-09-04 16:55 268次阅读
以FPGA作为硬件核心部分的自动温度采集控制系统...

如何区分FPGA与CPLD?本文告诉你答案!

如何区分CPLD或FPGA和哪一个更适合自己?这是一个老生常谈的问题,尤其是学生和初学者。如果您也...

发表于 2018-09-04 14:16 120次阅读
如何区分FPGA与CPLD?本文告诉你答案!

ROS KIT的拆箱图解以及功能演示,促进AI教...

日前,乐博士成功举办第一届ROS机器人AI编程夏令营,来自北京、上海、南京等多个城市的12名优秀青少...

发表于 2018-09-04 14:07 507次阅读
ROS KIT的拆箱图解以及功能演示,促进AI教...

“高云杯”山东省物联网创造力大赛开幕 将启动“千...

“高云杯”第五届山东省物联网创造力大赛(iSTAR2018)暨第十二届 iCAN 国际创新创业大赛决...

发表于 2018-09-04 08:47 1011次阅读
“高云杯”山东省物联网创造力大赛开幕 将启动“千...

三种不同的3D数据表示的基本深度学习方法

立体视觉将两个或以上摄像机相对于彼此固定在特定位置,并使用此设置捕获场景的不同图像,匹配相应的像素,...

发表于 2018-09-03 15:29 391次阅读
三种不同的3D数据表示的基本深度学习方法

基于FPGA的X-Y二维扫描台位置检测方案

用FPGA实现X-Y二维扫描台的位置检测电路,提高了系统的集成度,位置检测快速可靠。并且,FPGA工...

发表于 2018-09-03 10:09 298次阅读
基于FPGA的X-Y二维扫描台位置检测方案

FLIR对CVEDIAFLIR公司投资,将拓展A...

FLIR系统公司和新加坡CVEDIA公司联合宣布,FLIR已对CVEDIA进行战略投资,CVEDIA...

发表于 2018-09-02 11:33 735次阅读
FLIR对CVEDIAFLIR公司投资,将拓展A...

基于深度学习的任务图像理解:人脸识别与人物解析”

新加坡国立大学在读博士生赵健分享了“基于深度学习的任务图像理解:人脸识别与人物解析”,介绍了他博士期...

发表于 2018-09-02 10:27 470次阅读
基于深度学习的任务图像理解:人脸识别与人物解析”

TensorFlow都有哪些功能,大家是否都全部...

但如果你的数据量很大,那 TensorFlow 一定帮得上你。TensorFlow 已被用于寻找新的...

发表于 2018-09-02 10:20 392次阅读
TensorFlow都有哪些功能,大家是否都全部...

一种分布式深度学习网络,为不同机构间的合作提供了...

我们在多个不同的训练方法上进行了测试,并比较了结果。第一种方法是让神经网络在每个机构上单独训练,假设...

发表于 2018-09-02 09:54 452次阅读
一种分布式深度学习网络,为不同机构间的合作提供了...

谷歌与哈佛大学合作研究能否用深度学习技术预测余震...

为了训练和测试该模型,我们用的是SRCMOD在线数据集,其中含有有限断层模型。我们计算了SRCMOD...

发表于 2018-09-02 09:38 381次阅读
谷歌与哈佛大学合作研究能否用深度学习技术预测余震...

我国人工智能产业发展状况如何?人工智能在安防行业...

近日,从工业和信息化部获悉,今年以来,国内多个省市积极推进人工智能产业发展,在工业和信息化部和各省市...

发表于 2018-09-01 10:43 827次阅读
我国人工智能产业发展状况如何?人工智能在安防行业...

如何利用FPGA设计一个跨时钟域的同步策略?

基于FPGA的数字系统设计中大都推荐采用同步时序的设计,也就是单时钟系统。但是实际的工程中,纯粹单时...

发表于 2018-09-01 08:29 393次阅读
如何利用FPGA设计一个跨时钟域的同步策略?

ASIC大爆发,FPGA将沦为被取代的命运?

有人认为,除了人才短缺、开发难度较大,相比未来的批量化量产的ASIC芯片,FPGA在成本、性能、功耗...

发表于 2018-09-01 08:25 388次阅读
ASIC大爆发,FPGA将沦为被取代的命运?

中兴事件爆发和中美贸易战升级,能否为本土FPGA...

FPGA因技术门槛极高,全球市场份额主要被美国四大巨头高度垄断。据不完全统计,在全球约50亿美元的F...

发表于 2018-08-31 17:02 990次阅读
中兴事件爆发和中美贸易战升级,能否为本土FPGA...