电子发烧友网 > 可编程逻辑 > 正文

FPGA和GPU在深度神经网络方面谁更胜一筹

2020年01月07日 15:08 次阅读

(文章来源:电子工程世界)

在今天的大数据时代,企业和消费者被各种来源的海量数据淹没,包括商业交易、社交媒体以及传感器或机器对机器数据的信息。这些数据有多种格式,从传统数据库中的结构化数字数据到非结构化文本文档、电子邮件、视频、音频和金融交易。

对这些数据的有效分析是产生洞察力和驱动更好的决策制定和机器学习(ML)算法的关键,这些算法在现代数据分析中被广泛使用。深度卷积网络(DNN)作为一种特殊的ML算法,在图像分类中得到了广泛的应用。当前的一代DNN,如ALEXNET和VGG,依赖于密集浮点矩阵乘法(GEMM),这种算法具有规则的并行性和较高的TFLOPS(每秒浮点运算次数),能够很好地映射到GPU功能。

虽然FPGA比GPU更节能(在今天的物联网市场很重要),但它们在DNN上的性能与GPU并不匹配。英特尔进行的一系列测试评估了两种最新一代FPGA(英特尔的Arria TM10和statix TM10)与最新的高性能GPU (TItan X Pascal)在DNN计算上的性能。

由于数据并行计算具有规则的并行性和高浮点计算吞吐量,传统上DNN都使用GPU。每一代GPU都加入了更多的浮点单元、片上RAM和更高的内存带宽,以提供更多的浮点运算次数。然而,由于发散等问题,具有不规则并行性的计算可能会对GPU造成挑战。此外,由于GPU只支持一组固定的本地数据类型,定制定义的数据类型可能无法有效地处理,从而导致硬件资源利用率不足和性能不理想。

FPGA和GPU在深度神经网络方面谁更胜一筹

首先,下一代FPGA集成了更多的片上RAM。其次,像HYPERFLEX这样的技术可以显著提高频率。第三,还有更多的DSP可用。第四,HBM内存技术的集成导致芯片外带宽增加,最后,下一代FPGA将使用更先进的工艺技术,如14nm CMOS。

英特尔StraTIx 10 FPGA芯片拥有5000多个硬化浮点数单元(dsp),超过28MB的片上RAM (M20Ks),与高带宽内存(高达4x250GB/s/stack或1TB/s)集成,并改进了新HyperFlex技术频率,使得FP32吞吐量峰值9.2 Tflops。此外,FPGA开发环境和工具集也在不断发展,支持更高抽象级别的编程,开发人员更容易访问FPGA编程。

英特尔最近在研究下一代DNN的各种GEMM操作。开发了用于FPGA的DNN硬件加速模板,为开发稀疏矩阵算法和自定义数据类型提供了一流的硬件支持。该模板是为了支持各种下一代DNN而开发,并且可以定制,为用户给定的DNN变体生成优化的FPGA硬件实例。

该模板被用于运行和评估下一代DNN的各种关键矩阵乘法操作,当前和下一代FPGA (Arria 10, StraTIx 10)以及最新的高性能TItan X Pascal GPU.本研究结果发现,与Titan X Pascal GPU相比,在pruned, Int6和二值网络学习上(pruned, Int6, and binarized)DNNs的GEMM操作上,Stratix 10 FPGA的性能分别是Titan X Pascal GPU的1.1倍、1.5倍和5.4倍。

这些测试还表明,Arria 10和Stratix 10 FPGA相对于Titan X GPU提供了令人满意的能源效率(TOP/sec/watt),与Titan X相比,这两种设备的能源效率都提高了3到10倍。虽然GPU一直是支持DNN的无可争议的选择,但最近对两代Intel FPGA (Arria 10和Stratix 10)和最新的Titan X GPU的性能比较表明,当前DNN算法的趋势有利于FPGA,甚至FPGA可能提供更好的性能。
       (责任编辑:fqj)

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

小梅哥FPGA设计思想与验证方法视频教程

刚刚录制了一个fpga开发流程的视频,该视频为投石问路,主要是想听听大家对于小梅哥在录制视频时需要注意的内容以及希望系列
发烧友学院发表于 2016-03-24 00:00 37952次阅读
小梅哥FPGA设计思想与验证方法视频教程

FPGA的发展瓶颈有哪些,该如何解决

据Semico统计,FPGA市场正在逐年增长,而复合年均增长率高达38.4%,至2023年将具有55....
发表于 2020-01-07 15:23 0次阅读
FPGA的发展瓶颈有哪些,该如何解决

安路科技文余波:站在历史的关口,国产FPGA当自...

安路科技总经理文余波在接受采访时表示,安路科技能在FPGA市场上实现过亿的销售,证明了公司一直以来强....
发表于 2020-01-07 13:59 23次阅读
安路科技文余波:站在历史的关口,国产FPGA当自...

FPGA实现数据采集的方式对比(传统串口、数据采集卡及外设计接口)

数据采集在现代工业生产及科学研究中的重要地位日益突出,对实时高速数据采集的要求也不断提高。在信号测量、图像处理...
发表于 2020-01-07 07:00 130次阅读
FPGA实现数据采集的方式对比(传统串口、数据采集卡及外设计接口)

请问sdram中ref_timer计数器的值的问题?

程序中第一个always块中的9位计数器ref_timer计数到0之后,会重新回到511,等到再被调用的时候,从设定计数值递减。而...
发表于 2020-01-06 20:06 91次阅读
请问sdram中ref_timer计数器的值的问题?

英特尔Stratix 10 GX 10M FPG...

现场可编程门阵列(FPGA)的优势就是能够制造功能强大的芯片,可重复单元设计的性质,能够吸收工艺技术....
发表于 2020-01-06 15:31 26次阅读
英特尔Stratix 10 GX 10M FPG...

FPGA和GPU的市场竞争,谁才是未来的大局所向

一直以来,FPGA 的主要应用领域是电子工程。但当英特尔完成对 Altera(Altera 是最大的....
发表于 2020-01-06 15:26 34次阅读
FPGA和GPU的市场竞争,谁才是未来的大局所向

介绍FPGA中testbench的编写技巧

原来模块中的输入信号,定义成reg 类型,原来模块中的输出信号,定义为wire类型,但这里有个问题,....
发表于 2020-01-06 14:52 32次阅读
介绍FPGA中testbench的编写技巧

高云半导体成功量产Always-On超低功耗GW...

高云半导体基于超低功耗的非易失FPGA GW1NZ-ZV器件现已全面量产,此产品是迄今为止功耗最低的....
发表于 2020-01-06 10:29 88次阅读
高云半导体成功量产Always-On超低功耗GW...

智慧安防需求多样,AI安防芯片崛起契机来临

王朝是否结束先按下不表,但从2019年全年智能安防芯片的产出来看,ASIC、FPGA表现优秀,更是有....
发表于 2020-01-06 10:06 254次阅读
智慧安防需求多样,AI安防芯片崛起契机来临

NVIDIA下一代7nm GPU效率比Turin...

据悉,基于NVIDIA的下一代Ampere GPU的GeForce图形卡将比Turing GPU更快....
发表于 2020-01-06 01:56 831次阅读
NVIDIA下一代7nm GPU效率比Turin...

求助:基于FPGA的数字频率计设计

要求测量精度不低于10HZ,响应时间不高于250ms是什么意思?理解不了。 ...
发表于 2020-01-04 23:01 360次阅读
求助:基于FPGA的数字频率计设计

骁龙处理器日常使用差别到底大不大

你会不会眼花缭乱,这么多的处理器,似乎真的让我们不知道该怎么选择呢?今天,我们破开云雾,好好说一说这....
发表于 2020-01-04 10:25 527次阅读
骁龙处理器日常使用差别到底大不大

开年集结令丨四站Arm SoC开发技术研讨会强势...

SoC设计是一个复杂的过程,从架构定义、系统集成、功耗管理、软硬件交互和软件优化等的上层设计,再到S....
发表于 2020-01-02 16:54 142次阅读
开年集结令丨四站Arm SoC开发技术研讨会强势...

基于FPGA技术的RFID板的标签有什么不一样的

射频识别(RadioFrequencyIdentification,RFID)技术是一种新兴的非接触....
发表于 2020-01-02 16:38 103次阅读
基于FPGA技术的RFID板的标签有什么不一样的

AMD新款GPU核心Navi 12信息曝光,有望...

根据消息,知名爆料者Komachi在数据库中发现了AMD新款GPU核心 Navi 12的信息,AMD....
发表于 2020-01-02 15:20 605次阅读
AMD新款GPU核心Navi 12信息曝光,有望...

厂商发布新款被动散热PC,通过对CPU和GPU的...

根据消息报道,无风扇电脑机箱制造商Turemetal发布了新款被动散热PC的照片,这款PC采用了AM....
发表于 2020-01-02 14:40 336次阅读
厂商发布新款被动散热PC,通过对CPU和GPU的...

Imagination与苹果签署新协议 下一代i...

苹果很可能会习惯与以前的公司重新建立合作伙伴关系。首先是高通公司,最新传闻称该公司最终将在即将到来的....
发表于 2020-01-02 14:16 1441次阅读
Imagination与苹果签署新协议 下一代i...

随着数据中心的多样化需求 FPGA凭借其灵活性逐...

随着 5G 、AI、云计算、物联网、自动驾驶等新兴技术的快速演进,全球数据正呈指数级增长并呈海量聚焦....
发表于 2020-01-02 13:43 92次阅读
随着数据中心的多样化需求 FPGA凭借其灵活性逐...

5G、AI时代,FPGA的市场容量将迅速提升!

智能化已经成为一个最热的话题,而可穿戴设备以及智能移动设备的智能化更是大势所趋,对IC器件的要求越来....
发表于 2020-01-02 10:11 568次阅读
5G、AI时代,FPGA的市场容量将迅速提升!

Turemetal被动散热机箱可同时压制32核霄...

完全0噪音主机是许多玩家的梦想,有需求当然就有市场。不过此前市面上的被动式CPU散热器一般只能镇压5....
发表于 2020-01-02 09:12 439次阅读
Turemetal被动散热机箱可同时压制32核霄...

SignalTap II的特点、设置流程及逻辑分...

伴随着EDA工具的快速发展,一种新的调试工具Quartus II 中的SignalTap II 满足....
发表于 2020-01-01 17:39 641次阅读
SignalTap II的特点、设置流程及逻辑分...

简单分析FPGA的工作原理以及设计应用

FPGA(Field-Program mable Gate Array),即现场可编程门阵列,它是在....
发表于 2020-01-01 09:01 141次阅读
简单分析FPGA的工作原理以及设计应用

分享:FPGA设计原则总结

1.面积与速度的平衡与互换这里的面积指一个设计消耗 FPGA/CPLD 的逻辑资源的数量,对于 FPGA 可以用消耗的...
发表于 2020-01-01 08:00 381次阅读
分享:FPGA设计原则总结

拓普龙联合厚生富民推出自研的eyeball55 ...

深圳拓普龙科技有限公司与厦门厚生富民数据科技有限公司携手共同宣布推出基于全新自主研发的eyeball....
发表于 2019-12-31 17:26 707次阅读
拓普龙联合厚生富民推出自研的eyeball55 ...

数字信号处理的FPGA实现

数字信号处理的FPGA实现
发表于 2019-12-31 17:24 514次阅读
数字信号处理的FPGA实现

AI时代的FPGA你认为应该是什么样子的

FPGA的这种演变就像老式的有线台式电话演变成高度连接和集成的通信设备一样。
发表于 2019-12-31 16:46 326次阅读
AI时代的FPGA你认为应该是什么样子的

拓普龙联合厚生富民推出eyeball55 FPG...

目前,拓普龙已开发的数字经济智能商业基础设施包含了 eyeball55 AI 芯片、eyeM55 5....
发表于 2019-12-31 14:40 508次阅读
拓普龙联合厚生富民推出eyeball55 FPG...

DBCloud深脑云正式加入上海人工智能发展联盟

本次DBCloud深脑云加入上海人工智能发展联盟,不仅展示了联盟对DBCloud深脑云的认可,同时也....
发表于 2019-12-30 10:28 481次阅读
DBCloud深脑云正式加入上海人工智能发展联盟

GPU和CPU两者有什么差异

图形处理单元(GPU)是专用的微处理器,最初主要用于渲染游戏的3D图形,但现在正被考虑用于更广泛的应....
发表于 2019-12-27 16:14 339次阅读
GPU和CPU两者有什么差异

航锦科技全资子公司获两大FPGA订单 实现了该类...

12 月 27 日讯,航锦科技发布公告表示,公司的全资子公司长沙韶光半导体有限公司(简称“长沙韶光”....
发表于 2019-12-27 15:25 261次阅读
航锦科技全资子公司获两大FPGA订单 实现了该类...

NVIDIA总监:GPU在可编程比FPGA有优势

上周,在GTC19大会期间,NVIDIA加速计算产品管理总监Paresh Kharya对关于GPU相....
发表于 2019-12-27 14:47 614次阅读
NVIDIA总监:GPU在可编程比FPGA有优势

【发烧友研习社】史上最牛最全FPGA工程师的技能进阶必备资料(2200+份,共100G+)

本文由 发烧友研习社 服务号自主原创,版权所有侵权必究。 什么是FPGA? 也许您曾经有所耳闻,但您是否深入...
发表于 2019-12-26 12:02 905次阅读
【发烧友研习社】史上最牛最全FPGA工程师的技能进阶必备资料(2200+份,共100G+)

玩转Zynq连载45——[ex64] MT9V034摄像头的图像拉普拉斯锐化处理

1系统概述如图所示,这是整个视频采集系统的原理框图。上电初始,FPGA需要通过IIC接口对CMOS Sensor进行...
发表于 2019-12-26 09:13 308次阅读
玩转Zynq连载45——[ex64] MT9V034摄像头的图像拉普拉斯锐化处理

FPGA数字信号处理设计教程:SystemGenerator入门与提高.纪志成,高春能,吴定会

FPGA数字信号处理设计教程:SystemGenerator入门与提高.纪志成,高春能,吴定会 ...
发表于 2019-12-25 17:45 555次阅读
FPGA数字信号处理设计教程:SystemGenerator入门与提高.纪志成,高春能,吴定会

开年集结令丨四站Arm SoC开发技术研讨会强势来袭,约起来!

滴滴,你的2019余额已不足20天,对于即将到来的2020年,你又有什么期待呢?在崭新的一年里,Arm中国将为你带来更多的...
发表于 2019-12-25 09:58 2472次阅读
开年集结令丨四站Arm SoC开发技术研讨会强势来袭,约起来!

玩转Zynq连载44——[ex63] MT9V034摄像头的图像平滑处理

1系统概述如图所示,这是整个视频采集系统的原理框图。上电初始,FPGA需要通过IIC接口对CMOS Sensor进行...
发表于 2019-12-24 10:40 609次阅读
玩转Zynq连载44——[ex63] MT9V034摄像头的图像平滑处理