电子发烧友网 > 可编程逻辑 > 正文

采用StratixⅡ FPGA器件提高加法树性能并实现设计

2020年03月03日 10:45 次阅读

数字信号处理(DSP)技术在许多领域内具有广泛的用途,如雷达、图像处理、数据压缩、数字电视和数据通信等。加法器和乘法器是构成所有DSP系统的基本结构,而加法运算是最基本的算术运算,无论是减法、乘法、除法或FFT运算,最终都要分解为加法运算。随着在FPGA设计中加法功能需求的日益增长,加法树规模的日益增大,人们提出了很多实现加法功能的设计方法,以期在高的运算速度与低的逻辑占用之间求得最佳的实现效果。StratixⅡ是Altera公司推出的新一代高端FPGA,他采用了不同于以往系列FPGA的逻辑结构——自适应逻辑模块(ALM),这种ALM结构可以说是FPGA构架方面的革命。StraTIxⅡALM模块可以灵活配置为3~7输入的查找表(LUT),他包含内置的加法器块,能够一次完成最多3比特的加法而不需要耗费额外的LUT资源。对于通用算术和加法树功能,StraTIxⅡ器件比其他FPGA架构提供了更好的性能和更少的逻辑占用。

本文提出了一种针对StraTIxⅡ中ALM特点的加法树设计方案,给出了一个在高速数字相关器中的实际应用,并进行计算机综合测试验证。

1 、StraTIxⅡ的自适应逻辑模块(ALM)

FPGA的逻辑单元(LE)的经典结构是由一个4输入的LUT和一个触发器组成的。为什么是4输入而不是其他的逻辑结构呢,这是由于采用较“窄”的逻辑结构,比较节省硅片面积,但是总体性能比较差,而采用较“宽”的逻辑结构,总体性能比较好,但是浪费硅片面积,成本较高。所以采用4输入的LUT只是在成本和性能之间做的一个折衷。

图1给出的StratixⅡ的ALM正是兼有了“窄”的逻辑结构的高利用率和“宽”逻辑结构的高性能。ALM中的组合逻辑模块可以根据用户的需求由设计工具自动配置成需要的模式。可以配成5输入和3输入的LUT,或两个4输入的LUT等。另外,ALM内部独立于LUT之外还有两个3输入加法器,每个ALM中允许对3个不同的2 b数据进行加法操作。这种能力通过压缩加法树中总的步骤数,大大提高了加法树的性能,并且逻辑资源耗用也大大减少了,因为将3个1 b数据相加在StratixⅡ器件中只占用半个ALM,而对于传统的4输入LUT架构则需要2个LE。

图2列出了和传统的4输入LUT结构的FPGA相比较,采用ALM的StratixⅡFPGA器件例化3输入加法器的优势。从图2中可以清楚地看出,对于同样3个2 b数据相加的逻辑结构,传统4输入LUT结构的FPGA例化需2级完成,占用4个LE,而对于采用ALM的StratixⅡFPGA器件来例化,只需一个ALM即可。

采用StratixⅡ FPGA器件提高加法树性能并实现设计

2 、针对ALM的加法树设计

目前大多数FPGA都是基于传统的4输入LUT加上一个触发器的LE结构,如Altera的Stratix,APEX,Cy-clone和FLEX10K等器件族。他们在实现加法树时只能采用2输入加法树,而采用ALM结构的StratixⅡ器件实现加法树时,可根据需要采用3输入加法树或2输入加法树。这样,就能压缩加法树总的步骤数,提高加法树的性能。减少的加法树步骤n可由以下公式计算出:

这里N是指输入数据的数目。

对于传统的FPGA,如果实现A+B+C三个数的加法器,最高频率的方法是先实现2个数的加法,如A+B,将和用寄存器打一拍,然后将寄存器的和与第三个被加数(C)相加。这种方法实现1比特加法器时,A+B相加将使用1个加法器和1个寄存器,即一个LE,需1级逻辑完成。这种思路通常被称为2输入加法树结构,将加法树逐级拓展,可以实现更长的加法树结构。如果实现A+B+C+D+E五个数(16位)的加法树,使用这种2输入加法树方法共需3级寄存器缓存。其Verilog程序主要算法如下给出,选用器件StratixⅡEP2S15FC484-5,图3(a)给出了经过Synplify Pro 7.7综合后的RTL视图。综合结果为:默认约束条件下,共需64个ALM,实现估算的时钟频率为400.00 MHz。

采用StratixⅡ FPGA器件提高加法树性能并实现设计

采用StratixⅡ FPGA器件提高加法树性能并实现设计

由于ALM对输入可以在3到7之间自由配置,那么对于上述16比特的5个数的加数求和的加法器,可以让ALM配置成6输入的LUT,使用6-LUT可以同时完成3比特加法,用2个3输入的加法器取代上述的4个2输人加法器来实现。其算法如下给出,在其他同样条件下,综合后的RTL视图如图3(b)所示,综合结果为共需32个ALM,实现估算的时钟频率为427.30 MHz。可见节约了50%的ALM资源。

采用StratixⅡ FPGA器件提高加法树性能并实现设计

3 、加法树的应用

加法树在很多应用中出现,比如用在滤波器、乘法器、累加器、第三代(3G)无线基站的信道卡相关器等。下面以在数字通信系统中广泛应用的高速数字相关器为例来说明加法树的应用。

在数字通信系统中,常用一个特定的序列作为数据开始的标志,称为帧同步字,发送端在发送数据前插入帧同步字,接收端如果收到帧同步字就可以确定帧的起始位置,从而实现发送和接收数据的帧同步。数字相关器的作用是实现两个数字信号之间的相关运算,即比较等长度的两个序列间相等的位数。最基本的相关器是异或门。例如y=a○+b,当a=b时,y=0,表示数据位相同;当a≠b时,y=1,表示数据位不同。多位数字相关器可以由l位相关器级连构成。N位数字相关器的运算通常可以分解为以下两个步骤:

(1) 对应值进行异或运算,得到N个l位相关运算结果;

(2) 统计N位相关结果中0或1的数目,得到N位数字中相同位和不同位的数目。

对于一个32位的高速数字相关器,由于实现起来需要的乘积项、或门过多,因此为降低耗用资源,可以分解为8个4位相关器,然后用3级加法器相加得到全部32位的相关结果,这是传统的实现方法,如图4(a)所示。针对采用灵活的ALM结构的StratixII器件,可以采用3输入加法器来改进加法树,只用2级加法树就可完成,如图4(b)所示。

采用器件StratixⅡEP2S15FC484-5分别用2输入加法器树和3输入加法器树来实现上述相关器,SynplifyPro 7.7对图4(a)综合结果为占用80个ALUTs(自适应查找表)和56个FF(触发器),估算时钟频率为509.9 MHz。而对图4(b)综合结果为占用65个ALUTs和41个FF,估算时钟频率为465.0MHz。可见虽然稍微降低了时钟频率,但节省了大约20%的资源占用。

采用StratixⅡ FPGA器件提高加法树性能并实现设计

4 、结语

本文给出了使用StratixⅡFPGA实现加法树的方案及其在高速数字相关器中的应用。计算机综合仿真结果表明,该方案与传统实现加法树的方案比较,能通过压缩加法树中总的步骤数,大大减少了对FPGA逻辑资源的占用,并且随着加法树输入数据的数目增加,逻辑级和逻辑资源减少的百分比会更大。

       责任编辑:gt

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

对话FPGA原厂——既聊技术,也谈市场

感谢大家对Mil往期FPGA直播的支持!最后一期,大家要继续加油哟!关于直播中,Mill老师有提到的FPGA众筹,为大家
发烧友学院发表于 2019-05-22 00:00 5477次阅读
对话FPGA原厂——既聊技术,也谈市场

震惊!FPGA运算单元可支持高算力浮点

MLP全称Machine Learning Processing单元,是由一组至多32个乘法器的阵列....
发表于 2020-03-03 17:28 4次阅读
震惊!FPGA运算单元可支持高算力浮点

基于高精度可编程延迟单元实现高性能8倍采样器的设...

异步串行数据接口要求接收器恢复数据,方式是对比特流进行检查,并在所发送数据未附带时钟时确定每个位的采....
发表于 2020-03-03 17:04 16次阅读
基于高精度可编程延迟单元实现高性能8倍采样器的设...

跨时钟域信号处理中同步通信的设计的重要性及解决方...

上次提出了一个处于异步时钟域的MCU与FPGA直接通信的实现方式,其实在这之前,特权同学想列举一个异....
发表于 2020-03-03 10:10 37次阅读
跨时钟域信号处理中同步通信的设计的重要性及解决方...

基于视频速度应用在FPGA上实现的结构光中心线提...

随着测控技术及数字图像处理技术的高速发展,基于三角法线结构光的三维测量具有高精度、非接触、实时性和强....
发表于 2020-03-03 09:38 29次阅读
基于视频速度应用在FPGA上实现的结构光中心线提...

【新手咨询】如何使用labview与plc的多个保持寄存器通信?有发送有接受的那种

本人刚刚开始学习labview软件,现在需要使用dsc模块使用modbus rtu协议以rs485接口向下位机plc的保持寄存器发送指令,...
发表于 2020-03-02 20:31 90次阅读
【新手咨询】如何使用labview与plc的多个保持寄存器通信?有发送有接受的那种

MathWorks通过Universal Ver...

Wilson Research Group 的一项最近研究发现,48% 的 FPGA 设计项目和 7....
发表于 2020-03-02 18:12 29次阅读
MathWorks通过Universal Ver...

关于DSP的近距离无线通信的嵌入式数据记录设备设...

黑匣子是比较流行的电子记录设备之一,广泛应用于实时记录飞机、船舶、汽车等行进过程中的重要数据,包括速....
发表于 2020-03-02 17:06 168次阅读
关于DSP的近距离无线通信的嵌入式数据记录设备设...

SoC FPGA的数据采集如何解决与系统的交互问...

引言 Internet 的快速发展和成功促进了以太网(Ethernet)技术的发展和应用的扩展,所涉....
发表于 2020-03-02 16:18 78次阅读
SoC FPGA的数据采集如何解决与系统的交互问...

贸泽电子开售Analog AD7386逐次逼近寄...

贸泽电子(Mouser Electronics) 即日起开始供应Analog Devices公司的A....
发表于 2020-03-02 13:49 87次阅读
贸泽电子开售Analog AD7386逐次逼近寄...

可编程模拟IC可将FPGA的优势带入混合信号世界

对于工程师而言,设计、评估和调试带有模拟输入/输出(I/O)接口的混合信号电路始终面临巨大挑战。
发表于 2020-03-02 13:45 90次阅读
可编程模拟IC可将FPGA的优势带入混合信号世界

波形相位频率可调DDS信号发生器(设计分享)

波形相位频率可调DDS信号发生器(设计分享) --作者:造就狂野青春 本文为明德扬原创及录用文章,转载请注明出...
发表于 2020-03-02 11:15 186次阅读
波形相位频率可调DDS信号发生器(设计分享)

两片TMS320C6678 DSP的供电需求怎么满足?

TMS320C6678 DSP是TI最新发布的一款基于KeyStone架构的DSP,芯片内有8个内核,工作速度可达10 GHz.随...
发表于 2020-03-02 11:06 80次阅读
两片TMS320C6678 DSP的供电需求怎么满足?

【答疑】关于锁存器问题的讨论

关于锁存器问题的讨论    很多同学提问到锁存器的相关问题,说明大家对这方面知识还不是很了解,今天我们就...
发表于 2020-03-02 00:25 288次阅读
【答疑】关于锁存器问题的讨论

MathWorks实现自动化视觉系统设计 提高了...

2020 年 2 月 27 日– MathWorks 宣布,随着 2019b 发行版的 MATLAB....
发表于 2020-03-01 12:40 103次阅读
MathWorks实现自动化视觉系统设计 提高了...

FPGA原型系统可加速物联网的发展进程

当我们谈论物联网 (IoT) 的时候,不夸张地说,它可以将我们所使用的智能设备互相连接,彼此分享大量....
发表于 2020-02-29 14:36 93次阅读
FPGA原型系统可加速物联网的发展进程

CMOS传感器和FPGA如何助力智能相机的发展

人们很难预测哪些新技术会带来机器视觉发展的下一个突破,它可能来自多年学术研究的结果,或仅仅来自一个简....
发表于 2020-02-29 14:28 92次阅读
CMOS传感器和FPGA如何助力智能相机的发展

【工程源码】BMP2mif文件软件,方便使用ROM存储图像数据并显示

本文和设计代码由FPGA爱好者小梅哥编写,未经作者许可,本文仅允许网络论坛复制转载,且转载时请标明原作者。 ...
发表于 2020-02-28 20:03 177次阅读
【工程源码】BMP2mif文件软件,方便使用ROM存储图像数据并显示

【工程源码】已经安装器件库却报未安装——解决方案

本文和设计代码由FPGA爱好者小梅哥编写,未经作者许可,本文仅允许网络论坛复制转载,且转载时请标明原作者。 ...
发表于 2020-02-28 19:52 169次阅读
【工程源码】已经安装器件库却报未安装——解决方案

DSP28335使用CAN多节点通信出现问题

如图1,本实验使用的是DSP28335 3.3v供电VP230作为CAN通信节点node1;node2和node3为can通信的其他节点,在...
发表于 2020-02-28 17:23 153次阅读
DSP28335使用CAN多节点通信出现问题

请教,lattice mxo2做环形振荡器综合报错,什么原因?

fpga初学者,尝试做一个环形振荡器,使用lattice mxo2平台,diamond软件做。代码如下: [code]module  rin...
发表于 2020-02-28 15:37 183次阅读
请教,lattice mxo2做环形振荡器综合报错,什么原因?

AXI 代码 不通过 AXI Protocol Checker IP 的检测

https://gist.github.com/promach/251cbb3c9c9af401bf712dc4ccb76fb3 为何这个 AXI 代码 不通过 AXI Protoc...
发表于 2020-02-28 13:44 242次阅读
AXI 代码 不通过 AXI Protocol Checker IP 的检测

使用DSPBuilder时出现问题

本人初学者,刚装好DSPBuilder15.0(matlab2015a,quartus 15.0),在网上下载了一个实例,编译时出现错误,找了好...
发表于 2020-02-28 12:46 178次阅读
使用DSPBuilder时出现问题

利用片上高速网络(2D NoC)创新地实现FPG...

Achronix 最新基于台积电(TSMC)的7nm FinFET工艺的Speedster7t FP....
发表于 2020-02-27 17:08 591次阅读
利用片上高速网络(2D NoC)创新地实现FPG...

为什么测温仪的升级不可缺少FPGA

近段时间微信工作群最火的接龙莫过于“体温接龙”,一场来势汹汹的疫情让“测温”成为日常生活的一部分,更....
发表于 2020-02-27 14:58 161次阅读
为什么测温仪的升级不可缺少FPGA

莱迪思发布首款SOI的FPGA产品,AI芯片发展...

AI芯片设计大厂莱迪思半导体(Lattice Semiconductor),基于本身Nexus技术平....
发表于 2020-02-27 14:54 150次阅读
莱迪思发布首款SOI的FPGA产品,AI芯片发展...

MathWorks在FPGA和ASIC上实现自动...

Vision HDL Toolbox 自动生成经过 FPGA 验证的代码,适用于高达 8k 分辨率的....
发表于 2020-02-27 14:04 90次阅读
MathWorks在FPGA和ASIC上实现自动...

高云半导体与Rutronik GmbH打造分销联...

高云半导体宣布,授予Rutronik GmbH公司为其在EMEA和美洲地区的特许分销商。
发表于 2020-02-25 10:50 146次阅读
高云半导体与Rutronik GmbH打造分销联...

基于DSP芯片和以太网控制器实现风力发电机检测分...

风力发电作为一种绿色能源,因其无污染、可再生、方便而受到人们的重视且得到了迅猛的发展。风力发电机作为....
发表于 2020-02-25 09:59 139次阅读
基于DSP芯片和以太网控制器实现风力发电机检测分...

面对新冠肺炎,FPGA能为我们做些什么

2020年伊始,新型冠状病毒肺炎突然爆发并迅速蔓延,严格的防控措施成了这场战“疫”的关键。
发表于 2020-02-24 18:57 260次阅读
面对新冠肺炎,FPGA能为我们做些什么

高云半导体受邀德国Embedded World展...

广东高云半导体科技股份有限公司(以下简称“高云半导体”)将于2月25日至27日在德国纽伦堡参加Emb....
发表于 2020-02-24 16:36 190次阅读
高云半导体受邀德国Embedded World展...

自动驾驶计算芯片选型,GPU和FPGA谁更合适

自动驾驶域控制器,要具备多传感器融合、导航定位、路径规划、计算决策、V2X无线通讯、运动控制的能力。
发表于 2020-02-24 15:27 636次阅读
自动驾驶计算芯片选型,GPU和FPGA谁更合适

安路科技:基于FPGA SoC的呼吸机系统设计

呼吸机是可以完全替代病人的呼吸或实现辅助呼吸功能的仪器,适用于呼吸衰竭,甚至停止呼吸的病人,它能帮助....
发表于 2020-02-21 16:27 1170次阅读
安路科技:基于FPGA SoC的呼吸机系统设计

Achronix Speedster7t FPG...

将GDDR6的优势从图形计算扩展至高性能网络应用?下文主要介绍Achronix Speedster7....
发表于 2020-02-17 20:48 463次阅读
Achronix Speedster7t FPG...

FPGA到底是什么?为什么要使用它

最近几年,FPGA这个概念越来越多地出现。例如,比特币挖矿,就有使用基于FPGA的矿机。还有,之前微....
发表于 2020-02-16 10:50 899次阅读
FPGA到底是什么?为什么要使用它

4大主流CPU处理器的技术架构是怎么样的

RISC(精简指令集计算机)是一种执行较少类型计算机指令的微处理器,起源于80年代的MIPS主机(即....
发表于 2020-02-16 08:30 1096次阅读
4大主流CPU处理器的技术架构是怎么样的

边缘计算时代下FPGA的正确打开方式

从业者认为,5G 时代和工业领域最相关的技术就是边缘计算。其实,得益于技术本身拥有的及时处理和分析功....
发表于 2020-02-13 15:07 284次阅读
边缘计算时代下FPGA的正确打开方式

莱迪思即将发布首款SOI的FPGA产品

AI芯片设计大厂莱迪思半导体(Lattice Semiconductor),基于本身Nexus技术平....
发表于 2020-02-12 22:57 315次阅读
莱迪思即将发布首款SOI的FPGA产品

MAX6636的工作原理、性能特点及如何实现多点...

MAX6636是一个多通道的精密温度监测器,它不仅能监测本地温度,并且外部最多能接6个二极管。每一通....
发表于 2020-02-12 16:46 523次阅读
MAX6636的工作原理、性能特点及如何实现多点...

基于DSP+FPGA实现的TL6678F-Eas...

创龙结合TI KeyStone系列多核架构TMS320C6678及Xilinx Kintex-7系列....
发表于 2020-02-12 13:42 437次阅读
基于DSP+FPGA实现的TL6678F-Eas...

FPGA是什么FPGA有什么优势

现场可编程门阵列(FPGA)技术不断呈现增长势头。 1984年Xilinx刚刚创造出FPGA时,它还....
发表于 2020-02-12 10:07 1090次阅读
FPGA是什么FPGA有什么优势

赛灵思副总裁到访北京深维科技将进一步深化双方合作

近日,赛灵思VP(副总裁)DanGibbons一行到访北京深维科技,在CEO樊平及深维核心团队成员的....
发表于 2020-02-10 20:09 428次阅读
赛灵思副总裁到访北京深维科技将进一步深化双方合作

如何选择合适的单片机开发板

单片机是可编程器件,可以通过编程来实现逻辑功能,这不仅降低了产品设计的复杂度,更丰富了产品的功能。现....
发表于 2020-02-07 10:32 665次阅读
如何选择合适的单片机开发板

基于FPGA技术和微控制器实现将TS流数据转换为...

随着互联网的发展,人类进入了网络化、数字化的时代。在三网融合的政策背景下,数字电视信号的网络传输得到....
发表于 2020-02-07 10:04 649次阅读
基于FPGA技术和微控制器实现将TS流数据转换为...

GPU相比FPGA更具优势,更能适应AI快速的变...

在GTC19大会期间,NVIDIA 加速计算产品管理总监Paresh Kharya对关于GPU相比F....
发表于 2020-02-06 17:29 232次阅读
GPU相比FPGA更具优势,更能适应AI快速的变...

嵌入式里堆栈原理是怎么样的如何进行纯C实现

栈这种结构在嵌入式里其实是非常常用的,比如函数调用与返回就是典型的栈应用,虽然很多时候栈都是CPU系....
发表于 2020-02-06 16:23 831次阅读
嵌入式里堆栈原理是怎么样的如何进行纯C实现

FPGA和GPU谁才是未来市场的大局所向

一直以来,FPGA 的主要应用领域是电子工程。但当英特尔完成对 Altera(Altera 是最大的....
发表于 2020-02-05 21:19 353次阅读
FPGA和GPU谁才是未来市场的大局所向

实现带CPCI接口模块的AFDX终端通讯系统的设...

本文在研究航空全双工交换式以太网(Avionics Full Duplex Switched Eth....
发表于 2020-02-05 10:04 162次阅读
实现带CPCI接口模块的AFDX终端通讯系统的设...

ZSP G4架构和ZSP981 DSP核为移动通...

现在的高端智能手机需要同时支持GSM/GPRS/EDGE、TD-SCDMA、WCDMA/HSPA+、....
发表于 2020-02-05 09:57 206次阅读
ZSP G4架构和ZSP981 DSP核为移动通...

在视频应用的新领域,CPU和FPGA或将胜过GP...

在视频行业繁荣发展的背后,离不开互联网技术的日新月异。其中,视频行业的创新更是其中的佼佼者:从商业模....
发表于 2020-02-04 17:31 231次阅读
在视频应用的新领域,CPU和FPGA或将胜过GP...

智能电机会不会成为未来的主打市场

电机操控体系的分布式同时意味着电机操控产品的集成化,比方电机和电机驱动的集成,电机操控器和PLC的集....
发表于 2020-02-03 16:09 816次阅读
智能电机会不会成为未来的主打市场

计算架构迎来黄金时代,水大鱼大、风高浪急的新十年...

这一个新十年,时代的“大”和“快”从数字的比较上是以前难以想象的。大数据雪崩爆发时,每一片雪花都是意....
发表于 2020-01-20 17:20 10674次阅读
计算架构迎来黄金时代,水大鱼大、风高浪急的新十年...

Altera新发布一款多功能低成本的单芯片FPG...

一直以来,FPGA可编程器件都主要应用在通讯设备或工业控制等较为专业的应用领域,但随着不同行业使用需....
发表于 2020-01-17 16:33 674次阅读
Altera新发布一款多功能低成本的单芯片FPG...

采用双闭环PI和重复控制方案实现三相逆变器设计并...

本文利采用双闭环PI和重复控制相结合的控制方案,首先用双闭环PI控制算法,得到高动态特性的三相交流电....
发表于 2020-01-14 16:36 429次阅读
采用双闭环PI和重复控制方案实现三相逆变器设计并...