电子发烧友网 > 可编程逻辑 > 正文

“万能芯片”FPGA在深度学习领域的用法

2018年07月02日 07:59 次阅读

作者:邱陆陆

人工智能的风潮从技术一路蔓延到硬件,让“芯片”成为今年行业里盛极一时的主题。人们关注通用芯片领域里CPU和GPU不断刷新的基准(benchmark),更对专用芯片(ASIC)领域不同场景下不断问世的解决方案表示出了空前的热情。

而众所周知,在专用芯片与通用芯片中间,还有一个更为灵活,也更为神秘的领域:FPGA。无论是英特尔天价的收购还是微软与 IBM 雄心勃勃的计划,都让人对其更加好奇。而“万能芯片”的名称,以及多样化的职责范围:它可以是智能手机里不起眼的一个小组件,也可以是数千美金一块的开发板,也让人对其真面目更加疑惑。

FPGA 与深度学习的关系究竟是什么?它适合加速何种类型的运算?适合应用于何种场景?6 月,机器之心采访了美国伊利诺伊大学香槟分校电气与计算机工程系(UIUC ECE)教授、深度学习算法硬件加速解决方案创业公司 Inspirit IoT 创始人陈德铭,与他聊了聊“万能芯片”FPGA 在深度学习领域的用法。陈教授于近期宣布兼任国内计算机视觉领域创业公司触景无限的首席科学家。

以下为采访实录。

机器之心:从算法的角度,FPGA 适合于加速哪些运算?

FPGA 的优势在于可定制化的并行。它可以为了特定算法专门定制逻辑单元。例如,算法中需要完成一个开三次方的运算,在通用芯片上需要一长串指令实现它,但是在 FPGA 上可以为这个特定运算设计一个单元。

定制化的一个“极限”的例子是,如果能够把神经网络中的参数全部二值化、特征图(feature map)也全部二值化,那么甚至可以不用乘法器,而是用异或门(XOR gate)完成计算,会有异常强大的表现。即使不全部二值化,因为全部二值化会让准确度明显下降,只要合理使用各种低位宽的运算,仍可以让 FPGA 大放异彩。比如在我们最近和 IBM 合作的 ELB-NN 项目中,我们可以在功耗低于 5 瓦的情形下,让神经网络在 FPGA 上的算力达到 10.3 TOPS,同时依然维持非常高的准确度。

另一个例子是微软的 Brainwave FPGA 项目,通过使用特殊的 8-bit 的浮点运算,可以在高容量的 FPGA 上达到 40 TOPS。

值得一提的是,LSTM 等神经网络每一步操作都很相似,这种整体运算过程是序列的算法也非常适用于用 FPGA 进行加速。FPGA 非常擅长处理流数据,可以设计流水线机制,使得在运算过程中不需要将中间数据存入内存而是直接送到下一步进行操作。

机器之心:相比于其他芯片,FPGA 在实现深度学习模型时有哪些结构带来的优势?

FPGA 的引脚比一般的芯片多,同时它的逻辑单元可以完全根据算法要求来重组从而产生定制化的数据通路(datapath),因此非常适合处理大批量流数据。它不像 GPU 一样需要反复调取片外存储中的数据,理想状态时,只要数据一次性流进去再流出来,算法就完成了,因此,FPGA 非常适合具有低延迟需求的任务。

另外 FPGA 的速度快、功率低的特点也让它在能耗方面相比于 CPU、GPU 也有很大优势。

比如我们在 FPGA 上实现了长期循环卷积网络(Long-term Recurrent ConvoluTIonal Network),它的速度 ( latency ) 比 GPU 快 3.1 倍,FPGA 的功率比 GPU 小 5.6 倍,最终整体能耗降低 17 倍左右。

机器之心:从行业的角度,FPGA 都能够用于哪些机器学习与深度学习任务的加速?

在终端,有些自动驾驶公司的车上系统中就采用了 FPGA 完成一些实时检测识别任务。例如,我曾经代表 UIUC 与小鹏汽车的副总裁、机器学习专家谷俊丽女士交流,她提到,FPGA 可以凭借信号处理和低能耗方面的优势,成为一个可靠的第二系统,在汽车的第一系统出现失误的时候,作为安全模式介入进来。IoT 方面的应用就更多了,无论是安防还是智能家居,FPGA 都会有机会进入市场。

在云端,也有结合 FPGA 的巨大空间。之前,微软的 Project Catapult 就搭建起了大规模的 FPGA 云服务器。现在 Catapult 正在运行搜索和数据存储方面的运算,同时,他们也在积极地思考如何把机器学习运算部署在上面,包括是否能将 FPGA 作为其 Azure 云的后端支持。亚马逊 AWS 的 FPGA 云计算已经很有规模了,并且一直在大力推动之中。最近,国内创业公司深鉴也开始结合华为的云端 FPGA 来进行深度学习算法的加速,特别在基于 LSTM 的语音识别上非常有优势。

机器之心:能否介绍一下使用高层次综合(HLS)自动生成寄存器级(RTL)实现与手工用硬件描述语言(HDL)进行实现的区别?

对于深度学习相关算法来说,HLS 是有优势的。

当你阅读用高层语言描述的深度学习模型时,你会发现模型是有规律的。比如,卷积操作在 C 语言里就是一个六层的嵌套循环。此时我就可以针对这个循环开发一个 IP 核,确定如何进行流水线设计(pipelining),如何分配存储等,然后再将 IP 核用在 FPGA 上,进而让神经网络中的所有卷积层来共享 IP 核即可。

此时设计的优化要点是 IP 核的大小、是否需要多个 IP 核并行运算等。这是一个非常适用 HLS 的场景,因为 HLS 可以自动化地、快速地探索不同的解决方案。如果采用 RTL,则需要很多工程师,组成多个团队,每个团队根据工程师过去的设计经验着重探索一个方向,这是一个成本非常高的过程。

RTL 是一种描述硬件的空间的关系和逻辑时序等逻辑关系的硬件描述语言。这是一门难学的语言,能够熟练掌握的从业者也不多,开发和测试都很慢。夸张点说,如果 HLS 开发周期以天和周来计算,那么 RTL 通常是以月和年。

从最终结果角度讲,RTL 完全手工调制的解决方案是很可能比 HLS 自动生成的方案效果好的。我们曾经做过比较,在深度学习的情境下,HLS 和 RTL 方法的差距在 10% 左右。

因此,问题在于是否愿意花 3-5 倍的时间获得额外 10% 的效果。

机器之心:在简化 FPGA 开发过程这一任务上,研究者做了哪些工作?

我们的团队开发了一个研究工具,是一个 C 语言的模板库,能够根据 Caffe 和 TensorFlow 的代码自动生成 C 语言的表达。然后研究者可以将 C 语言的代码再交给 HLS 工具生成 RTL 代码。

C 语言是软件工程师普遍掌握的语言,这样的工具让软件工程师也具有 FPGA 开发能力,而且让开发者更专注于算法,而不用过多考虑底层硬件。

而且,这个过程中的中间结果都可以导出,专业人员也可以在自动生成的基础上再进行优化,总而言之,整个开发的效率都得到了极大的提高。

这只是举一个例子。还有其它很多的研究人员在做相关的提升深度学习设计效率和质量的各类工具和平台。工业和学术届的都有。学术届比如 UCLA 的丛京生老师,以及 Cornell 的张志汝老师等。工业届比较领先的是赛灵思和英特尔自己设计的一些工具。

机器之心:各个大公司在 FPGA 的应用方面都进行了哪些工作?拓展市场的思路都有哪些?

IBM 和赛灵思正在 Power 系列上进行合作,致力于在 FPGA 上加更多的存储,在最新的原型机上,把存储加到了 64G,相比于市面上现在常见的最大 8 或 16G,极大扩展了数据带宽,来进行和大数据相关的处理。

英特尔收购了 Altera,并且致力于帮助 Altera 进行编译等工具的开发。这是一个 FPGA 商品化的思路,就像 GPU 一样,说不定未来的 PC 里就会有一个 FPGA 协处理器在 CPU 旁边完成工作。或者在芯片层面上,CPU 片上就有一块 FPGA。总而言之,一旦工具做好,整合的机会会有很多。英特尔在智能城市、智慧制造方面都有很多的构想,并且希望借由 FPGA 实现。

再就是微软。它的思路主要就是云计算,除了 Bing 之外,也希望在进行机器学习任务的 Azure 云中使用 FPGA。

机器之心:能否介绍一下 Inspirit IoT 通过哪些产品实现了深度学习算法在 FPGA 上的加速?

Inspirit IoT创始人陈德铭:“万能芯片”FPGA在深度学习领域的用法

我们公司主要有三个产品,按照层次分别是 DNN 优化器、高层次综合加速编译器(HLS compiler),以及整体 FPGA 解决方案。

DNN 优化器的目标是定制一个 FPGA 友好的模型,把训练好的模型中对于推理来说冗余的部分去掉。例如,训练时使用的浮点数可以被替换为定点数,训练时每层有非常多的单元,但是在推理的时候可以进行剪枝(Pruning),等等。DNN 优化器就是以各种高层框架的模型为基础,根据硬件的特性和场景的特性进行自动的优化。

高层次综合编译器让开发者得以绕开写 Verilog 硬件描述语言,将 C、 C++、CUDA 等代码直接编成 FPGA,旨在降低硬件开发的门槛,提高软件工程师的生产力。我们的特色是这个编译器可以自然结合深度学习算法中的各种 IP 核,从而可以最好的优化各种深度学习算法在 FPGA 上的高速及高质量的实现。

除此之外,我们也有嵌入 FPGA 的开发板,用于声音相关的应用场景。其上嵌入了 FPGA 和 4 个麦克风,可以检测声音来源、提高声音质量,也可以和摄像头等其他设备连用。例如,捕捉到车辆撞击声、尖叫声等特定声音之后,能够调转摄像头,收录相关的视频等,希望获得一个「1+1>3」的效果。

技术专区

关注电子发烧友微信

有趣有料的资讯及技术干货

下载发烧友APP

打造属于您的人脉电子圈

关注发烧友课堂

锁定最新课程活动及技术直播
收藏 人收藏
分享:

评论

相关推荐

借助NVIDIA GPU重塑医学图像分析领域

在过去十年中,腹部超声波检查方法一直没有发生太大变化,医生仍然需要一边在患者的腹部移动探头一边盯住屏...

发表于 2018-07-04 16:52 67次阅读
借助NVIDIA GPU重塑医学图像分析领域

深度学习与数据挖掘的关系

发表于 2018-07-04 16:07 40次阅读
深度学习与数据挖掘的关系

日媒:人类不该为未来感到悲伤,人工智能不会抢走你...

日本《日经商贸》周刊6月18日刊登了题为《人工智能不会争夺人类就业的三个理由》的文章

发表于 2018-07-04 15:50 60次阅读
日媒:人类不该为未来感到悲伤,人工智能不会抢走你...

今年人工智能可能为企业创造1.2万亿美元的商业价...

根据调研机构Gartner的统计,2018年人工智能可能为企业创造1.2万亿美元的商业价值,将比去年...

发表于 2018-07-04 15:37 85次阅读
今年人工智能可能为企业创造1.2万亿美元的商业价...

关于FPGA的几点问题,你了解吗?

因此,要想学好FPGA,你得用硬件的思维方式来编写代码,注重FPGA的系统结构设计,好的系统结构设计...

发表于 2018-07-04 14:12 25次阅读
关于FPGA的几点问题,你了解吗?

Zynq、FPGA等相关芯片可以运用到那些领域

因为Zynq-7000 PS(Processing System)端嵌入了Cortex-A9 ARM...

发表于 2018-07-04 14:12 18次阅读
Zynq、FPGA等相关芯片可以运用到那些领域

人工智能技术能预测和防止死亡?

如果你知道你确切的死亡时间,你愿意吗? 这个问题可能不像你想象的那么不靠谱,一个新的算法,它可分析...

发表于 2018-07-04 10:30 178次阅读
人工智能技术能预测和防止死亡?

Uri Shalit 发文称:标准化逻辑回归和深...

Uri Shalit 在 Twitter 上发文,指出这篇论文的补充材料里,有一处结果非常值得注意...

发表于 2018-07-04 10:15 88次阅读
Uri Shalit 发文称:标准化逻辑回归和深...

Xilinx品牌FPGA使用的三种证书

JESD204B协议是目前高速AD,DA通用的协议。对于基带使用FPGA用户来说,Xilinx品牌的...

发表于 2018-07-04 10:12 13次阅读
Xilinx品牌FPGA使用的三种证书

乘法器的使用方法你知道哪些?

在做项目的过程中,经常遇到乘法计算,乘法器的设计就尤为重要。乘法器决定了最终电路功能能否实现,资源使...

发表于 2018-07-04 09:41 93次阅读
乘法器的使用方法你知道哪些?

UC伯克利教授Stuart Russell:人工...

Russell是加州大学伯克利分校人工智能系统中心创始人兼计算机科学专业教授,同时还是人工智能领域里...

发表于 2018-07-04 09:41 236次阅读
UC伯克利教授Stuart Russell:人工...

预览版AR云游戏平台——Niantic Real...

然而凭借着Matrix Mill的技术,皮卡丘可以隐藏在灌木丛或者行人后面,创造出了更真实的世界,能...

发表于 2018-07-04 09:29 89次阅读
预览版AR云游戏平台——Niantic Real...

数据集使用的Kaggle中辨别狗狗种类的竞赛

运用预训练深度学习模型最直接的策略之一是将它们看作特征提取器。在现代神经网络架构发展之前,图像特征是...

发表于 2018-07-04 09:11 112次阅读
数据集使用的Kaggle中辨别狗狗种类的竞赛

一种用于图像分类的卷积神经网络

卷积神经网络的特点是逐层提取特征,第一层提取的特征较为低级,第二层在第一层的基础上继续提取更高级别...

发表于 2018-07-04 08:59 215次阅读
一种用于图像分类的卷积神经网络

FPGA中文VHDL语言基础教程

发表于 2018-07-04 01:11 11次阅读
FPGA中文VHDL语言基础教程

针对智能驾驶应用,深度学习应该如何落地呢?

张晖认为,主要存在着两大关键点,第一需要贴近任务和系统需求,即必须针对智能驾驶系统应用对感知层的需求...

发表于 2018-07-03 16:53 185次阅读
针对智能驾驶应用,深度学习应该如何落地呢?

BatchNorm是一种旨在通过固定层输入的分布...

作者探讨了BatchNorm,优化和Internal Covariate Shift三者之间的关系。...

发表于 2018-07-03 14:37 85次阅读
BatchNorm是一种旨在通过固定层输入的分布...

关于基于Profibus-DP总线的位移传感器设...

测量技术是现代工业生产和科学研究中必不可少的一项技术,其中基于磁致伸缩效应的位移测量技术因其稳定性好...

发表于 2018-07-03 14:06 125次阅读
关于基于Profibus-DP总线的位移传感器设...

Quartus II中FPGA的管脚分配保存方法

发表于 2018-07-03 12:56 43次阅读
Quartus II中FPGA的管脚分配保存方法

小米要做移动端最牛叉的深度学习框架

所以2016年底,我们已经把AI,作为小米未来核心战略的重要组成部分,作为未来十年、甚至二十年的核心...

发表于 2018-07-03 11:53 481次阅读
小米要做移动端最牛叉的深度学习框架

一种称为标签映射(LM)的方法来解决大规模分类问...

CIFAR-100 数据集由60000张100个类别的32x32彩色图像构成,每个类别有500张训练...

发表于 2018-07-03 11:44 125次阅读
一种称为标签映射(LM)的方法来解决大规模分类问...

深度学习为什么依赖于超大的计算能力?

虽然许多硬件计算单元(GPU、FPGA 等)的计算能力很强大,但是它们的内存资源(即设备内存)非常稀...

发表于 2018-07-03 11:42 137次阅读
深度学习为什么依赖于超大的计算能力?

关于交叉熵在loss函数中使用的理解

这样就可以计算出某一种可能性的信息量。举一个例子,假设你拿出了你的电脑,按下开关,会有三种可能性,下...

发表于 2018-07-03 11:32 187次阅读
关于交叉熵在loss函数中使用的理解

深度学习会是犯罪行为吗?欧洲“史上最严”的数据保...

Sandra Wachter博士也认为,基于人工智能的系统往往是不透明的“黑盒子”,难以仔细检查。随...

发表于 2018-07-03 11:22 328次阅读
深度学习会是犯罪行为吗?欧洲“史上最严”的数据保...

ICLR 2018和ICRA 2018两个会议进...

从抽象点的观点来看,这涉及到具有表现力的、可优化的函数家族的能力,例如神经网络。 Minimax优化...

发表于 2018-07-03 10:37 95次阅读
ICLR 2018和ICRA 2018两个会议进...

FPGA在自动驾驶车内部发挥的重要作用详细资料概...

虽然每个人都希望宣示ASIC的所有权,但大部份最先进的处理都是以FPGA完成的,它让用户有机会在高效...

发表于 2018-07-03 10:34 558次阅读
FPGA在自动驾驶车内部发挥的重要作用详细资料概...

一个端到端的深度学习系统,可以将足球比赛的You...

以 YouTube 视频的帧作为输入,我们使用 field lines 来恢复摄像机参数。然后,提取...

发表于 2018-07-03 10:30 109次阅读
一个端到端的深度学习系统,可以将足球比赛的You...

fpga数码管动态扫描程序分享

发表于 2018-07-03 10:23 25次阅读
fpga数码管动态扫描程序分享

使用Xilinx Vivado设计套件创建一个...

Xilinx以制造 可编程门阵列(FPGA)而闻名,它是基于一个通过可编程接点连接的可配置逻辑块(C...

发表于 2018-07-03 10:19 50次阅读
 使用Xilinx Vivado设计套件创建一个...

基于FPGA的Cordic算法实现的设计与验证

本文是基于FPGA实现Cordic算法的设计与验证,使用Verilog HDL设计,初步可实现正弦、...

发表于 2018-07-03 10:18 39次阅读
基于FPGA的Cordic算法实现的设计与验证

使用深度学习,制作“图片+文字”型的表情包

数据集是这个表情包生成器的精髓。他们的数据集由大约40万张带标签和图说的图片组成。其中有2600个独...

发表于 2018-07-03 10:14 123次阅读
使用深度学习,制作“图片+文字”型的表情包

Facebook提出了一种Exemplar GA...

这个问题对人类来说似乎很容易,只要稍微想象一下,大家很容易就能脑补出洞里应该有什么。但是,这个任务对...

发表于 2018-07-03 09:57 121次阅读
Facebook提出了一种Exemplar GA...

一种新方法来检测这些被操纵的换脸视频的“迹象”

利用深度学习“换脸”合成假视频的技术发展之快令人惊叹,也令人深感不安。研究人员已经研究出一种新方法来...

发表于 2018-07-03 09:48 105次阅读
一种新方法来检测这些被操纵的换脸视频的“迹象”

北京之所以被称为AI一哥,不是没有道理

这部白皮书显示,全国4000多家人工智能企业中,北京人工智能企业达到1070家,占比26%;全国获得...

发表于 2018-07-03 09:41 244次阅读
北京之所以被称为AI一哥,不是没有道理

一个神经元的ResNet就是一个通用的函数逼近器

从何恺明等人2015年提出以来,ResNet甚至被认为是当前性能最佳的网络结构。ResNet的成功得...

发表于 2018-07-03 09:15 200次阅读
一个神经元的ResNet就是一个通用的函数逼近器

身体的运动可以通过音乐信号进行计算预测吗?

除了预测点之外,我们的另一个目标是通过动画形象的方式来可视化这些点,让动画人物根据给定的音频输入自主...

发表于 2018-07-03 09:08 251次阅读
身体的运动可以通过音乐信号进行计算预测吗?

基于FPGA +AD7609的数据采集系统的实现...

随着信息技术的发展,特别是各种数字处理器处理速度的提高,人们对数据采集系统的要求越来越高,特别是在一...

发表于 2018-07-03 09:01 72次阅读
基于FPGA +AD7609的数据采集系统的实现...

数字图像水印的FPGA实现步骤

未加水印的图像表示为f水印表示为w,常数a控制水印和衬底图像的相对可见性。如果a为1,则水印是不透明...

发表于 2018-07-03 08:22 45次阅读
数字图像水印的FPGA实现步骤

Xilinx Zynq-7000系列:基于ARM...

该委员会专门设计用于与来自锡林克斯的PYNQ项目合作,并使用Python语言和库,设计师可以创建高性...

发表于 2018-07-03 08:17 46次阅读
Xilinx Zynq-7000系列:基于ARM...

de1-soc FPGA(Quartus工程含Qsys系统) + HPS 操作步骤

发表于 2018-07-03 08:10 29次阅读
de1-soc FPGA(Quartus工程含Qsys系统) + HPS 操作步骤

基于FPGA的DDS频率合成器设计视频教程与源码下载

发表于 2018-07-03 06:06 32次阅读
基于FPGA的DDS频率合成器设计视频教程与源码下载

FPGA学习笔记之嵌入式锁相环模块ALTPLL的配置和调用

发表于 2018-07-03 02:52 23次阅读
FPGA学习笔记之嵌入式锁相环模块ALTPLL的配置和调用

FPGA几种特殊分频方式

发表于 2018-07-03 02:44 27次阅读
FPGA几种特殊分频方式

FPGA时序时序分析中的基本概念

发表于 2018-07-03 02:11 24次阅读
FPGA时序时序分析中的基本概念

虚拟JTAG工具在FPGA调试中的应用

发表于 2018-07-03 00:53 28次阅读
虚拟JTAG工具在FPGA调试中的应用

清华大学魏少军教授:从IA到AI,我们还要走多远

清华大学魏少军教授指出,未来10年,人工智能和深度学习将成为提升硅片需求的主导因素。到2025年,人...

发表于 2018-07-02 18:10 733次阅读
清华大学魏少军教授:从IA到AI,我们还要走多远

AI教父Geoff Hinton和深度学习的40...

坚持你所相信的,直到世界追上你的脚步。因为伤了背,Geoff Hinton已经站着工作了12年,似乎...

发表于 2018-07-02 15:32 176次阅读
AI教父Geoff Hinton和深度学习的40...

汇总几种开源的深度学习模型以及针对姿态估计的代码

DensePose的论文中提出了DensePose-RCNN,这是Mask-RCNN的一种变体,可以...

发表于 2018-07-02 14:44 248次阅读
汇总几种开源的深度学习模型以及针对姿态估计的代码

用CycleGAN把《堡垒之夜》转成《绝地求生》...

CycleGAN是加州大学伯克利分校研究人员提出的一种用于跨域图到图转换的GAN,它可以把一类图像的...

发表于 2018-07-02 14:33 182次阅读
用CycleGAN把《堡垒之夜》转成《绝地求生》...

一种针对深度强化学习运动任务的自动环境

这类似蜘蛛的机器人是可以灵活拆卸的,中间的本体是一个六边形的形状,每一面都可以利用磁铁吸附上一条“机...

发表于 2018-07-02 14:24 148次阅读
一种针对深度强化学习运动任务的自动环境

新思科技公司宣布集成化混合原型验证解决方案

通过对新设计的功能使用Virtualizer虚拟原型技术和对重用逻辑使用基于FPGA的HAPS原型技...

发表于 2018-07-02 11:50 47次阅读
新思科技公司宣布集成化混合原型验证解决方案

利用多视图几何技术重建场地和球员的3D模型

于是识别球员的重任就落在了深度学习网络上,而它的训练方法又显得十分巧妙。有别于传统的训练方式,此系统...

发表于 2018-07-02 10:22 140次阅读
利用多视图几何技术重建场地和球员的3D模型

一种思考数学表达式的轻松方法——计算图

如果要理解计算图上的导数,一个关键在于我们如何理解每一条带箭头的线(下称“边”)上的导数。以之前的连...

发表于 2018-07-02 08:43 227次阅读
一种思考数学表达式的轻松方法——计算图

2018版的“针对编程者的深度学习课程大致介绍

在这节课中,我们关注的重点从单一物体转向了多个物体检测。结果表明这种改变让问题的难度增加。事实上,大...

发表于 2018-07-02 08:39 245次阅读
2018版的“针对编程者的深度学习课程大致介绍

基于卷积神经网络的组合模型处理NLP任务讽刺检测

数据为均衡和失衡的讽刺推文数据集,取自Ptacek等2014年的工作和The Sarcasm Det...

发表于 2018-07-02 08:37 464次阅读
基于卷积神经网络的组合模型处理NLP任务讽刺检测

Xilinx新一代UltraScale架构成为A...

近年来,ASIC设计规模的增大带来了前所未有的芯片原型验证问题,单颗大容量的FPGA通常已不足以容下...

发表于 2018-07-02 08:20 44次阅读
Xilinx新一代UltraScale架构成为A...

Xilinx Spartan-6系列封装概述和管...

 Spartan-6系列具有低成本、省空间的封装形式,能使用户引脚密度最大化。所有Spartan-6...

发表于 2018-07-01 10:48 59次阅读
Xilinx Spartan-6系列封装概述和管...

FPGA简单门电路怎么实现?

verilog实现反相器,2输入与门、2输入或门、2输入与非门、2输入或非门、2输入异或门、2输入同...

发表于 2018-07-01 10:28 73次阅读
FPGA简单门电路怎么实现?

RNN及其变体LSTM和GRU

下图为一个双层LSTM对三个不同的单词的反应分布。该LSTM每层有600个细胞状态单元,基于Penn...

发表于 2018-06-30 11:11 213次阅读
RNN及其变体LSTM和GRU

图像增强的主要方法及其Python实现

在本文中,我们将查看如何应用这些变换至图像,包括3D图像,及其对深度学习模型表现的影响。我们将使用f...

发表于 2018-06-30 10:07 730次阅读
图像增强的主要方法及其Python实现

从AlexNet到ResNet的网络架构进步

自从2012年AlexNet在竞赛中成功“超神”后,参加ILSVRC 2013的CNN模型数量大幅提...

发表于 2018-06-30 10:03 528次阅读
从AlexNet到ResNet的网络架构进步

卫星图像进行目标识别仍然困难重重,美国提出了一种...

为了解决模型无法检测像素过小的目标、难以生成全新比例的图像等限制,我们提出了一种经过优化的为卫星图像...

发表于 2018-06-30 09:41 213次阅读
卫星图像进行目标识别仍然困难重重,美国提出了一种...

深度学习开发者Artem Oppermann介绍...

乍看起来,能量这一术语和深度学习没什么关系。相反,能量是一个物理概念,例如,重力势能描述了具有质量的...

发表于 2018-06-30 09:15 389次阅读
深度学习开发者Artem Oppermann介绍...

一些人会怀疑:难道神经网络不是最先进的技术?

如上图所示,sigmoid的作用确实是有目共睹的,它能把任何输入的阈值都限定在0到1之间,非常适合概...

发表于 2018-06-30 08:55 353次阅读
一些人会怀疑:难道神经网络不是最先进的技术?

深度学习模型优于人类医生?

2017年,Esteva等人发表论文,宣布他们创建了一种基于卷积神经网络的深度学习模型,可以对图片进...

发表于 2018-06-30 08:40 263次阅读
深度学习模型优于人类医生?

传统图像与视频压缩技术

从以上的编解码过程中,我们可以看到,先验概率估计的精确程度对编码的效率影响很大。HEVC使用动态更新...

发表于 2018-06-30 08:27 252次阅读
传统图像与视频压缩技术

2018年最受欢迎的机器学习技术及其趋势

结果显示,Torch/PyTorch 与 TensorFlow 的相关性最高,其次是 Jupyter...

发表于 2018-06-29 16:54 704次阅读
2018年最受欢迎的机器学习技术及其趋势

NVIDIA推出9个新的HPC和可视化容器

容器的其他主要优点还包括提供了可重复性和可移植性。用户可在不安装应用的情况下,在各种系统上运行工作负...

发表于 2018-06-29 16:13 1583次阅读
NVIDIA推出9个新的HPC和可视化容器

关于基于FPGA和ARM的虚拟软盘实现

随着硬件技术的进步,软盘逐渐被新的存储介质代替。但部分旧设备(比如织布机等)并不支持这些更快、容量更...

发表于 2018-06-29 14:26 215次阅读
关于基于FPGA和ARM的虚拟软盘实现

关于基于FPGA的HDMI多模式显示模块的设计

随着社会信息化程度的不断提高,人们对视频处理的要求越来越高,视频处理系统处理的数据量也越来越大。在嵌...

发表于 2018-06-29 14:13 222次阅读
关于基于FPGA的HDMI多模式显示模块的设计

关于基于FPGA的多模式数字匹配滤波器的设计与实...

数字匹配滤波器是直接序列扩频通信系统中的关键部件,可以通过编程实现接收端同步和解扩,提高通信系统数字...

发表于 2018-06-29 14:12 182次阅读
关于基于FPGA的多模式数字匹配滤波器的设计与实...

RAM分为简单双口RAM和真双口RAM

真双口RAM给设计带来很多便利。在高速存储中,需要对连续的数据同时处理,使用简单双口RAM只能读取一...

发表于 2018-06-29 08:54 755次阅读
RAM分为简单双口RAM和真双口RAM

Windows应用程序,操作系统,计算机硬件之间...

前面说过操作系统能很好的去操作底层硬件,但是不知道什么时候去操作和操作到了什么程度,这些都是由应用程...

发表于 2018-06-29 08:49 300次阅读
Windows应用程序,操作系统,计算机硬件之间...

MIT研究揭示大脑可塑性基本规则

MIT最新研究证实,当一个神经元突触增强时,它周围的神经元会变弱。这对于当下大热的神经网络来说,又会...

发表于 2018-06-28 16:36 235次阅读
MIT研究揭示大脑可塑性基本规则

DNN与逻辑回归效果一样?

谷歌用深度学习分析电子病例的重磅论文给出了一个意外的实验结果,DNN与逻辑回归效果一样,引发了热烈讨...

发表于 2018-06-28 16:01 206次阅读
DNN与逻辑回归效果一样?

华为云智能体连接物理世界实现智能世界

华为云的智能体以及深度学习、图像搜索两项AI云服务成为用AI为云计算打开更多空间的钥匙。

发表于 2018-06-28 15:58 404次阅读
华为云智能体连接物理世界实现智能世界

LT3070:为FPGA和服务器应用设计的稳压...

采用低电压运作的新式 FPGA 和服务器对于细微的电源电压下降很敏感。这种压降可能是以下因素综合作用...

发表于 2018-06-28 12:13 204次阅读
 LT3070:为FPGA和服务器应用设计的稳压...

关于基于FPGA的可消除高频非线性的动态分频鉴相...

鉴相技术是电力电子系统和测试控制中的关键技术之一,在仪器仪表、通信、导航定位、研究网络相频特性和锁相...

发表于 2018-06-28 11:53 240次阅读
关于基于FPGA的可消除高频非线性的动态分频鉴相...

基于Xilinx 16nm Virtex Ult...

基于Xilinx 16nm Virtex UltraScale+ 器件VU9P的异构计算实例F3在阿...

发表于 2018-06-28 09:57 530次阅读
基于Xilinx 16nm Virtex Ult...

基于FPGA的图像加速解决方案

百度云云市场从产品、技术、客户资源等多渠道,开放资源与能力,引入第三方合作伙伴,与合作伙伴深度合作,...

发表于 2018-06-28 09:51 875次阅读
基于FPGA的图像加速解决方案

关于 LTM4643 的特性介绍与应用

LTM4643 是一款四输出降压型 μModule® (电源模块) 稳压器,该器件可配置为单输出 (...

发表于 2018-06-28 04:14 332次阅读
关于 LTM4643 的特性介绍与应用

decaNLP——同时处理十项自然语言任务的通用...

目前的NLP领域有一个问题:即使是再厉害的算法也只能针对特定的任务,比如适用于机器翻译的模型不一定可...

发表于 2018-06-27 15:07 346次阅读
decaNLP——同时处理十项自然语言任务的通用...

如何快速简单地训练神经网络?

对深度线性网络学习的非线性动力学的精确解进行理论分析后发现,满足了动态等距的权重初始化能够大大提高学...

发表于 2018-06-27 14:11 348次阅读
如何快速简单地训练神经网络?

FPGA系统中三种方式减少亚稳态的产生

在FPGA系统中,如果数据传输中不满足触发器的Tsu和Th不满足,或者复位过程中复位信号的释放相对于...

发表于 2018-06-27 10:11 94次阅读
FPGA系统中三种方式减少亚稳态的产生

FPGA设计的“三个代表”:Ultrafastd...

UFDM建议正确的HDL coding风格来满足目标器件,讨论时序约束和时序收敛。正确的IO约束,I...

发表于 2018-06-27 09:50 59次阅读
FPGA设计的“三个代表”:Ultrafastd...

便携式GNSS导航信号采集回放系统,可编写针对K...

该系统的监控端采用了基于CortexA8系列的ARM处理器,该处理器同时兼顾了成本与性能的要求,可设...

发表于 2018-06-27 09:15 77次阅读
便携式GNSS导航信号采集回放系统,可编写针对K...

关于FPGA的功耗评估需要知道些什么

项目设计初期会选型,工程师根据资源、IO、硬核、IP等选择对应型号的FPGA。功耗部分xilinx提...

发表于 2018-06-27 09:05 61次阅读
关于FPGA的功耗评估需要知道些什么

一种基于机器视觉和深度学习的智能路牌识别系统

在智能路牌识别系统中,挑选日常常用的3 000个汉字进行了训练,基于国家标准规定——道路路牌采用方...

发表于 2018-06-27 08:46 446次阅读
一种基于机器视觉和深度学习的智能路牌识别系统

新一代SoC FPGA提供系统可信根,防止关键数...

物联网(IoT)的规模和复杂性不断上升,对主动的强化安全措施的需求日益增加。仅利用软件安全功能已经不...

发表于 2018-06-27 08:31 78次阅读
新一代SoC FPGA提供系统可信根,防止关键数...

一款系统能识别逐渐朝你走来的老板,并且自动隐藏正...

首先,让电脑通过深度学习掌握老板的脸。然后,在我的工位上设置一个摄像头,当捕捉到老板的脸时,屏幕可以...

发表于 2018-06-26 16:28 308次阅读
一款系统能识别逐渐朝你走来的老板,并且自动隐藏正...

人工智能的发展过程

从0到1,再从1到100这个类比能很好地形容技术及产品的发生发展过程。比如福特造出第一辆T型车可以认...

发表于 2018-06-26 16:21 395次阅读
人工智能的发展过程

百度推出NCRF算法,癌症转移检测准确率喜人

昨天,百度研究院宣布他们开发了一种深度学习算法,在检测乳腺癌的微转移方面超过了人类病理学医生的表现。

发表于 2018-06-26 15:25 343次阅读
百度推出NCRF算法,癌症转移检测准确率喜人

一个深度学习模型能完成几项NLP任务?

对于机器翻译、文本摘要、Q&A、文本分类等自然语言处理任务来说,深度学习的出现一遍遍刷新了state...

发表于 2018-06-26 15:19 330次阅读
一个深度学习模型能完成几项NLP任务?

将深度学习和常微分方程结合在一起,提供四大优势

Hinton创建的向量学院的研究者提出了一类新的神经网络模型,神经常微分方程(Neural ODE)...

发表于 2018-06-26 11:19 245次阅读
将深度学习和常微分方程结合在一起,提供四大优势

广告界的“奥斯卡”上,出现了中国的AI

6月20日,戛纳国际创意节上出现了一款AI智能文案产品,可以根据商品自动生成文案,并且文案品质与人写...

发表于 2018-06-26 11:14 561次阅读
广告界的“奥斯卡”上,出现了中国的AI

自动驾驶技术目前有点过分炒作,自动驾驶事故也被过...

但对于自动驾驶系统来说,这就不是特别真实了。例如,特斯拉的自动驾驶就利用雷达和超声波传感器系统弥补了...

发表于 2018-06-26 09:55 398次阅读
自动驾驶技术目前有点过分炒作,自动驾驶事故也被过...

简单介绍了强化学习的基本概念

可一旦你尝试去触摸它。哎呦!火把你的手烧伤了(惩罚-1).你才明白只有与火保持一定距离,才会产生温暖...

发表于 2018-06-26 09:10 594次阅读
简单介绍了强化学习的基本概念

FPGA需要跑多快?影响FPGA计算性能的几大因...

我们写软件程序的时候,习惯了给函数很多参数作为条件,根据参数内容执行函数的操作。FPGA做计算就不希...

发表于 2018-06-25 16:46 394次阅读
FPGA需要跑多快?影响FPGA计算性能的几大因...

一项将2D RGB图像的所有人类像素实时映射至3...

为了让机器可以学习,研究人员手动标记了5万张照片中的336个点,光这个步骤就是一个巨大的工程了,如果...

发表于 2018-06-25 16:13 341次阅读
一项将2D RGB图像的所有人类像素实时映射至3...

为什么使用FPGA?FPGA为什么比GPU的延迟...

计算密集型任务的例子包括矩阵运算、图像处理、机器学习、压缩、非对称加密、Bing 搜索的排序等。这类...

发表于 2018-06-25 16:02 455次阅读
为什么使用FPGA?FPGA为什么比GPU的延迟...