电子发烧友网 > 可编程逻辑 > 正文

FPGA的发展瓶颈有哪些,该如何解决

2020年01月07日 15:23 次阅读

(文章来源:21IC中国电子网)

据Semico统计,FPGA市场正在逐年增长,而复合年均增长率高达38.4%,至2023年将具有55亿-60亿美元的规模。Achronix Semiconductor 总裁兼首席执行官Robert Blake表示对于FPGA近年的市场增长非常兴奋,相信在庞大高速增长的市场中新产品将有出色的表现。

据统计,约有25%的企业选择入局AI/ML以保持企业自身的竞争力,未来两年内,将会有接近四分之三的企业会布局AI。而AI方面,算法仍在不断演进,数值精度选择越来越多样性,但仅依赖数据格式的转变降低能耗的方法已接近瓶颈,市场需要更具有高效计算力、高效大带宽的数据运送能力、丰富储缓存能力的最高能效比的广适应性平台。

除此之外,Speedster7t FPGA具有革命性的新型二维片上网络(2D NoC)和一系列针对高带宽和人工智能/机器学习(AI / ML)应用进行了优化的新型机器学习处理器(MLP)。另外,值得一提的是,Speedster7t FPGA还具有满足未来AI/ML需求所需的超高带宽接口,包括400G以太网端口、用于数据传输的PCI Express Gen5端口以及用于业界最灵活、低成本、高带宽存储的GDDR6控制器。

利用四个架构代系的硬件和软件开发基础上的创新和积淀,客户可以拥有更快的设计周期、更好的设计表现,另外,还可以降低设计中的风险、减少所需设计面积。

Blake表示:“我们正处于智能化、自学习计算的高增长阶段的早期,这种计算将广泛影响我们日的常生活。” Semico Research公司ASIC和SoC首席市场分析师Rich Wawrzyniak表示:“全新的系列产品是创新性芯片架构实现爆发的一个卓越案例,创造该架构的目的是直接面向AI应用处理大量的数据。”

如今,为了适应当前应用的高速发展,大多公司的设计团队开始选择全新的方案。众所周知,ASIC具有高性能、低功耗的优势,但相对来说,其内核执行外的任何算法都是冻结的,所以FPGA的高灵活性、高适应性相比来说更具优势。那么,有没有一款产品即具有FPGA的适应性,也兼顾ASIC的超高表现力?

FPGA的发展瓶颈有哪些,该如何解决

Speedster7t FPGA系列产品正是将二者相融合,利用台积电(TSMC)7nm技术,构建出全新的具有高性能、低功耗、高灵活性、高适应性的FPGA+。

假若将400G内容传送到以太网比作在传送带上传送,影响传输的除了传送带速度,还有盒子的大小。传输速度需要足够快确保来得及装包,而越大的盒子也会降低效率。传统FPGA在传输400G内容时,无论如何调整传输大小和传输频率,也无法达到以太网的传输曲线。所以对于传统FPGA几乎无法满足超高速的传输条件。

来自Speedster7t高速I / O和存储器端口的数万兆比特数据很容易淹没传统FPGA面向比特位的可编程互连逻辑阵列的路由容量,而Speedster7t架构包含一个可横跨和垂直跨越FPGA逻辑阵列的创新性的、高带宽的二维片上网络(NOC),它们连接到所有FPGA的高速数据和存储器接口。

它们就像叠加在FPGA互连这个城市街道系统上的空中高速公路网络一样,Speedster7t的NoC支持片上处理引擎之间所需的高带宽通信。NoC中的每一行或每一列都可作为两个256位实现,单向的、行业标准的AXI通道,工作频率为2Ghz,同时可为每个方向提供512 Gbps的数据流量。

通过在Speedster中实现专用二维 NoC,极大地简化了高速数据移动,并确保数据流可以轻松地定向到整个FPGA结构中的任何自定义处理引擎。最重要的是,NOC消除了传统FPGA使用可编程路由和逻辑查找表资源在整个FPGA中移动数据流中出现的拥塞和性能瓶颈。这种高性能网络不仅可以提高Speedster7t FPGA的总带宽容量,还可以在降低功耗的同时提高有效LUT容量。

传统FPGA使用DSP模块有着相对有限的表现力,具体表现在不高效的数值精度支持、需要消耗额外逻辑和Memory资源、性能受限于FPGA布线

Speedster7t FPGA搭载全新的机器学习处理器(MLP),将计算、存储和程序集于一身,使其支持阵列式乘累积计算架构、内嵌缓存、可配置以支持演进中算法、支持广泛各种不同整点和浮点格式。大规模的可编程计算单元平行阵列是其核心,可提供业界最高的、基于FPGA的计算密度,另外,也具有最高的能效比。

MLP是高度可配置的、计算密集型的单元模块,可支持4到24位的整点格式和高效的浮点模式,包括对TensorFlow的16位格式的支持,以及可使每个MLP的计算引擎加倍的增压块浮点格式的直接支持。

MLP与嵌入式存储器模块紧密相邻,通过消除传统设计中与FPGA布线相关的延迟,来确保以750 MHz的最高性能将数据传送到MLP。这种高密度计算和高性能数据传输的结合使得处理器逻辑阵列能够提供基于FPGA的最高可用计算能力以每秒万亿次运算数量为单位(TOPS,Tera-Operations Per Second)。

高性能计算和机器学习系统的关键之处是高片外存储器带宽,从而为多个数据流提供存储源和缓冲。 Speedster7t器件是唯一支持GDDR6存储器的FPGA,该类存储器是具有最高带宽的外部存储器件。每个GDDR6存储控制器都能够支持512 Gbps的带宽,Speedster7t器件中有多达8个GDDR6控制器,可以支持4 Tbps的GDDR6累加带宽,并且以很小的成本就可提供与基于HBM的FPGA等效存储带宽。

“美光(Micron)乐于携手Achronix去实现全球第一个面向高带宽存储需求而直接加载了GDDR6的FPGA产品,”美光计算与联网业务部营销副总裁Mal Humphrey。“像这样的创新的和可扩展的解决方案将推动人工智能领域内的差异化,其中异构计算可选方案与高性能的存储是加速获得数据内涵的必需部分。”

非凡的存储带宽需要好的“后卫”才能真正发挥出其性能。Speedster7t器件包括业界最高性能的接口端口,以支持极高带宽的数据流。Speedster7t器件拥有多达72个业界最高性能的SerDes,可以达到1到112 Gbps的速度。还有带有前向纠错(FEC)的硬件400G以太网MAC,支持4x 100G和8x 50G的配置,以及每个控制器有8个或16个通道的硬件PCI Express Gen5控制器。
       (责任编辑:fqj)

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

小梅哥FPGA设计思想与验证方法视频教程

刚刚录制了一个fpga开发流程的视频,该视频为投石问路,主要是想听听大家对于小梅哥在录制视频时需要注意的内容以及希望系列
发烧友学院发表于 2016-03-24 00:00 37952次阅读
小梅哥FPGA设计思想与验证方法视频教程

FPGA和GPU在深度神经网络方面谁更胜一筹

在今天的大数据时代,企业和消费者被各种来源的海量数据淹没,包括商业交易、社交媒体以及传感器或机器对机....
发表于 2020-01-07 15:08 8次阅读
FPGA和GPU在深度神经网络方面谁更胜一筹

FPGA中面积换速度该如何去实现

在FPGA中,如果要将一个采样率为480MHz,中频频率为302.5MHz的信号变频到零中频的基带信....
发表于 2020-01-07 14:45 0次阅读
FPGA中面积换速度该如何去实现

安路科技文余波:站在历史的关口,国产FPGA当自...

安路科技总经理文余波在接受采访时表示,安路科技能在FPGA市场上实现过亿的销售,证明了公司一直以来强....
发表于 2020-01-07 13:59 23次阅读
安路科技文余波:站在历史的关口,国产FPGA当自...

FPGA实现数据采集的方式对比(传统串口、数据采集卡及外设计接口)

数据采集在现代工业生产及科学研究中的重要地位日益突出,对实时高速数据采集的要求也不断提高。在信号测量、图像处理...
发表于 2020-01-07 07:00 134次阅读
FPGA实现数据采集的方式对比(传统串口、数据采集卡及外设计接口)

请问sdram中ref_timer计数器的值的问题?

程序中第一个always块中的9位计数器ref_timer计数到0之后,会重新回到511,等到再被调用的时候,从设定计数值递减。而...
发表于 2020-01-06 20:06 92次阅读
请问sdram中ref_timer计数器的值的问题?

英特尔Stratix 10 GX 10M FPG...

现场可编程门阵列(FPGA)的优势就是能够制造功能强大的芯片,可重复单元设计的性质,能够吸收工艺技术....
发表于 2020-01-06 15:31 26次阅读
英特尔Stratix 10 GX 10M FPG...

FPGA和GPU的市场竞争,谁才是未来的大局所向

一直以来,FPGA 的主要应用领域是电子工程。但当英特尔完成对 Altera(Altera 是最大的....
发表于 2020-01-06 15:26 34次阅读
FPGA和GPU的市场竞争,谁才是未来的大局所向

介绍FPGA中testbench的编写技巧

原来模块中的输入信号,定义成reg 类型,原来模块中的输出信号,定义为wire类型,但这里有个问题,....
发表于 2020-01-06 14:52 32次阅读
介绍FPGA中testbench的编写技巧

高云半导体成功量产Always-On超低功耗GW...

高云半导体基于超低功耗的非易失FPGA GW1NZ-ZV器件现已全面量产,此产品是迄今为止功耗最低的....
发表于 2020-01-06 10:29 88次阅读
高云半导体成功量产Always-On超低功耗GW...

在台积电5nm有重大改进,比特大陆和嘉楠耘智最早...

台积电表示即将量产的5nm工艺实现了重大改进,与7nm工艺相比,在功耗、性能和面积等方面都得到了巨大....
发表于 2020-01-05 11:12 335次阅读
在台积电5nm有重大改进,比特大陆和嘉楠耘智最早...

求助:基于FPGA的数字频率计设计

要求测量精度不低于10HZ,响应时间不高于250ms是什么意思?理解不了。 ...
发表于 2020-01-04 23:01 360次阅读
求助:基于FPGA的数字频率计设计

开年集结令丨四站Arm SoC开发技术研讨会强势...

SoC设计是一个复杂的过程,从架构定义、系统集成、功耗管理、软硬件交互和软件优化等的上层设计,再到S....
发表于 2020-01-02 16:54 142次阅读
开年集结令丨四站Arm SoC开发技术研讨会强势...

基于FPGA技术的RFID板的标签有什么不一样的

射频识别(RadioFrequencyIdentification,RFID)技术是一种新兴的非接触....
发表于 2020-01-02 16:38 103次阅读
基于FPGA技术的RFID板的标签有什么不一样的

随着数据中心的多样化需求 FPGA凭借其灵活性逐...

随着 5G 、AI、云计算、物联网、自动驾驶等新兴技术的快速演进,全球数据正呈指数级增长并呈海量聚焦....
发表于 2020-01-02 13:43 92次阅读
随着数据中心的多样化需求 FPGA凭借其灵活性逐...

5G、AI时代,FPGA的市场容量将迅速提升!

智能化已经成为一个最热的话题,而可穿戴设备以及智能移动设备的智能化更是大势所趋,对IC器件的要求越来....
发表于 2020-01-02 10:11 568次阅读
5G、AI时代,FPGA的市场容量将迅速提升!

SignalTap II的特点、设置流程及逻辑分...

伴随着EDA工具的快速发展,一种新的调试工具Quartus II 中的SignalTap II 满足....
发表于 2020-01-01 17:39 641次阅读
SignalTap II的特点、设置流程及逻辑分...

Zynq的电源上电顺序

因为ZYNQ 的PS 和PL 部分的电源有上电顺序的要求,在电路设计中,按照ZYQN 的电源要求设计....
发表于 2020-01-01 17:27 304次阅读
Zynq的电源上电顺序

简单分析FPGA的工作原理以及设计应用

FPGA(Field-Program mable Gate Array),即现场可编程门阵列,它是在....
发表于 2020-01-01 09:01 144次阅读
简单分析FPGA的工作原理以及设计应用

分享:FPGA设计原则总结

1.面积与速度的平衡与互换这里的面积指一个设计消耗 FPGA/CPLD 的逻辑资源的数量,对于 FPGA 可以用消耗的...
发表于 2020-01-01 08:00 381次阅读
分享:FPGA设计原则总结

拓普龙联合厚生富民推出自研的eyeball55 ...

深圳拓普龙科技有限公司与厦门厚生富民数据科技有限公司携手共同宣布推出基于全新自主研发的eyeball....
发表于 2019-12-31 17:26 707次阅读
拓普龙联合厚生富民推出自研的eyeball55 ...

数字信号处理的FPGA实现

数字信号处理的FPGA实现
发表于 2019-12-31 17:24 514次阅读
数字信号处理的FPGA实现

台积电最新5纳米应用,首批客户是它们

据中时电子报报道,比特大陆(Bitmain)和嘉楠耘智(Canaan)这两家专门开发应用于挖掘加密货....
发表于 2019-12-31 17:15 527次阅读
台积电最新5纳米应用,首批客户是它们

AI时代的FPGA你认为应该是什么样子的

FPGA的这种演变就像老式的有线台式电话演变成高度连接和集成的通信设备一样。
发表于 2019-12-31 16:46 326次阅读
AI时代的FPGA你认为应该是什么样子的

拓普龙联合厚生富民推出eyeball55 FPG...

目前,拓普龙已开发的数字经济智能商业基础设施包含了 eyeball55 AI 芯片、eyeM55 5....
发表于 2019-12-31 14:40 508次阅读
拓普龙联合厚生富民推出eyeball55 FPG...

比特大陆首款5nm ASIC已在本月流片 相关矿...

相较于苹果、华为旗下的SoC或者AMD的GPU,打造一款矿机专用的ASIC芯片难度小很多。早些年挖矿....
发表于 2019-12-30 15:09 578次阅读
比特大陆首款5nm ASIC已在本月流片 相关矿...

航锦科技全资子公司获两大FPGA订单 实现了该类...

12 月 27 日讯,航锦科技发布公告表示,公司的全资子公司长沙韶光半导体有限公司(简称“长沙韶光”....
发表于 2019-12-27 15:25 261次阅读
航锦科技全资子公司获两大FPGA订单 实现了该类...

NVIDIA总监:GPU在可编程比FPGA有优势

上周,在GTC19大会期间,NVIDIA加速计算产品管理总监Paresh Kharya对关于GPU相....
发表于 2019-12-27 14:47 614次阅读
NVIDIA总监:GPU在可编程比FPGA有优势

GPU和FPGA谁更适合自动驾驶计算芯片的应用

自动驾驶域控制器,要具备多传感器融合、导航定位、路径规划、计算决策、V2X无线通讯、运动控制的能力。
发表于 2019-12-26 15:47 182次阅读
GPU和FPGA谁更适合自动驾驶计算芯片的应用

FPGA在边缘计算大时代下的正确打开方式

5G时代和工业领域最相关的技术就是边缘计算。其实,得益于技术本身拥有的及时处理和分析功能,边缘计算很....
发表于 2019-12-26 15:43 158次阅读
FPGA在边缘计算大时代下的正确打开方式

【发烧友研习社】史上最牛最全FPGA工程师的技能进阶必备资料(2200+份,共100G+)

本文由 发烧友研习社 服务号自主原创,版权所有侵权必究。 什么是FPGA? 也许您曾经有所耳闻,但您是否深入...
发表于 2019-12-26 12:02 906次阅读
【发烧友研习社】史上最牛最全FPGA工程师的技能进阶必备资料(2200+份,共100G+)

玩转Zynq连载45——[ex64] MT9V034摄像头的图像拉普拉斯锐化处理

1系统概述如图所示,这是整个视频采集系统的原理框图。上电初始,FPGA需要通过IIC接口对CMOS Sensor进行...
发表于 2019-12-26 09:13 308次阅读
玩转Zynq连载45——[ex64] MT9V034摄像头的图像拉普拉斯锐化处理

FPGA数字信号处理设计教程:SystemGenerator入门与提高.纪志成,高春能,吴定会

FPGA数字信号处理设计教程:SystemGenerator入门与提高.纪志成,高春能,吴定会 ...
发表于 2019-12-25 17:45 555次阅读
FPGA数字信号处理设计教程:SystemGenerator入门与提高.纪志成,高春能,吴定会

开年集结令丨四站Arm SoC开发技术研讨会强势来袭,约起来!

滴滴,你的2019余额已不足20天,对于即将到来的2020年,你又有什么期待呢?在崭新的一年里,Arm中国将为你带来更多的...
发表于 2019-12-25 09:58 2472次阅读
开年集结令丨四站Arm SoC开发技术研讨会强势来袭,约起来!

玩转Zynq连载44——[ex63] MT9V034摄像头的图像平滑处理

1系统概述如图所示,这是整个视频采集系统的原理框图。上电初始,FPGA需要通过IIC接口对CMOS Sensor进行...
发表于 2019-12-24 10:40 609次阅读
玩转Zynq连载44——[ex63] MT9V034摄像头的图像平滑处理