0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

调用HLS的FFT库实现N点FFT

Hack电子 来源:Hack电子 2023-07-11 10:05 次阅读

在HLS中用C语言实现8192点FFT,经过测试,实验结果正确,但是时序约束不到100M的时钟,应该是设计上的延时之类的比较大,暂时放弃这个方案,调用HLS中自带的FFT库(hls:fft)hls_fft.h。实际上,在HLS中调用该库实现FFT,其实是Vivado中的那个FFT核实现的,但是HLS中的配置和给定输入输出数据比较方便,并且对其外部封装其他类型的总线接口非常容易。

1.hls_fft.h初探

在HLS中打开示例例程 fft_single ,注意以下几点:

(1)默认设定

【1】输入数据和输出数据的格式固定,必须采用16位定点复数数据,其中1bit表示整数,其他的表示小数部分,即输入数据范围 —1 ~ 1,输出也是 —1 ~ 1;

【2】结构类型为流水线型;

【3】默认点数1024点,当不是这个点数时,除了修改头文件的点数,还需要修改config里的参数才能重新配置IP核;

【4】默认输入输出16位定点,相位因子16位,如果需要改成浮点数输入输出,需要更改相位因子为24或25位,并且在config里面更改IP核的配置;

【5】HLS中的FFT的IP库只处理复数类型complex的FFT数据。

【6】Xilinx FFT IP块只对复数类型数据进行操作。尽管可以对把所有虚部都设为0的复数进行FFT,但是通过预处理数据可以更有效地执行FFT。

【7】HLS需要bit-reverse命令数据块后端,所说的自然顺序和一个O (N)转换适用于FFT输出提取的频谱数据N-point真实数据集。注意,第一个输出两包第0个和512(纯粹的)分别输出频谱数据的实部和虚部。

【8】设计是完全流水线,流设计高吞吐量;用于数据的连续处理,但具有节流功能(如果输入停止,则停止)。

【9】AXI4-Stream接口用于连接IP Integrator (IPI)中的所有块。

(2)在testbench中自己给输入信号进行测试,先给定一个正弦信号,注意下面的赋值,在2016.2版本是可以直接给复数的实部和虚部赋值的,但是2018.2这种方式会报错,需要采用下面的赋值函数来给一个复数赋值

043befd2-1f8f-11ee-962d-dac502259ad0.png

(3)scale放缩因子的设定 如果不设置放缩因子,输入上述 —1 ~ 1的正弦信号后,输出结果应该为

0457b064-1f8f-11ee-962d-dac502259ad0.png

可以看到,最大值在x[100]处,虚部已经到-503级别,不符合输出数据的要求,在此过程中,需要对数据按照FFT的级数缩放,如下图所示,示例中设置1024点的FFT的放缩因子为0X2AB,即 10 10 10 10 11,按照每2bit合在一起,即为 2 2 2 2 3,依次相加为(2+2+2+2+3)=11,放缩倍数为2^11=2048。

04708990-1f8f-11ee-962d-dac502259ad0.png

具体scale的设置详见PG109,翻译过来就是:

对于突发I/O架构,每个阶段的扩展调度由最低位的两个LSBs指定,第一个阶段的扩展调度由两个最低位LSBs指定。缩放可以指定为3、2、1或0,表示要移位的数目。例如:

【1】对于N =1024, Radix-4突发I/O是[1 0 2 3 2](从最后一级开始排序)

【2】对于N =128, x-2突发I/O或Radix-2 Lite Burst I/O,一种可能的扩展计划是[1 1 1 1 1 0 1 2] (从最后阶段到第一阶段排序)。

对于流水线并行I/O架构(示例默认使用流水线型),每个Radix-2阶段(从两个LSBs开始)都使用两位指定伸缩因子。例如:

【4】N = 256的缩放调度可以是[2 2 2 3]。当N不是4的幂时,最后阶段的最大位增长为1位。例如,[0 2 2 2]或[1 2 2 2 2]对于N = 512是有效的扩展调度,但是[2 2 2 2 2]是无效的。对于这个转换长度,SCALE_SCH的最高位的两个MSB只能是00或01。此字段仅适用于按比例缩放的算术(不包括未缩放unscaled、块浮点或单精度float)。

048d5ade-1f8f-11ee-962d-dac502259ad0.png

2.更改配置

(1)改成8192点FFT(2^13)

【1】更改最大支持点数FFT_NFFT_MAX=13,这时候FFT_LENGTH也随之改变,效果为该FFT支持最大8192点(当设置为最大支持8192点时,4096/256等比8192小的点数也是支持的),并且本次运行点数时8192点。

04d30534-1f8f-11ee-962d-dac502259ad0.png

【2】修改config配置信息,将修改的点数写进fft的配置,如果没有110行的修改,那么实际上还是执行的1024点的FFT。

0501d2c4-1f8f-11ee-962d-dac502259ad0.png

【3】修改放缩因子为0XAAB(8192点FFT,缩小8192倍,一般多少点设置多少倍,然后看overflow信号是否指示数据溢出,若溢出,则继续增大缩放因子)

052c4a7c-1f8f-11ee-962d-dac502259ad0.png

此后点击运行,得到的结构范围在 —1 ~ 1之间,将所有数据*8192,得到正常的数据,但是,因为前面的放缩实在每一级上的累计放缩,所以存在较大的误差累积,通过和C语言double型正常未放缩执行的代码对比,发现在输出数据较小的地方误差非常大,基本可以看成是错的,在数据较大的地方,比如本例的100Hz的sin信号,在输出xk_output[100] 处与实际结果误差很小。

3.更改输入输出为float型,提高精度

对于单精度浮点型输入,输入数据时N维复数向量(双32位浮点数),相位因子必须是24或者25位的定点数(PG109文档)。

0564c938-1f8f-11ee-962d-dac502259ad0.png

059993f2-1f8f-11ee-962d-dac502259ad0.png

4.结果

05c4c9f0-1f8f-11ee-962d-dac502259ad0.png

05e852b2-1f8f-11ee-962d-dac502259ad0.png

0608efea-1f8f-11ee-962d-dac502259ad0.png

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1602

    文章

    21320

    浏览量

    593194
  • FFT
    FFT
    +关注

    关注

    15

    文章

    425

    浏览量

    58638
  • 时钟
    +关注

    关注

    10

    文章

    1479

    浏览量

    130306
  • C语言
    +关注

    关注

    180

    文章

    7530

    浏览量

    128620
  • HLS
    HLS
    +关注

    关注

    1

    文章

    126

    浏览量

    23683

原文标题:FPGA实现OFDM通信——FFT与IFFT——调用HLS的FFT库实现N点FFT(hls:fft)

文章出处:【微信号:Hack电子,微信公众号:Hack电子】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【安富莱——DSP教程】第32章 实数FFT实现

    第32章实数FFT实现 本章主要讲解实数的浮点和定点Q31,Q15的实现。关于这部分的知识和函数的计算结果上,官方的文档有一些小错误,在章节中会跟大家详细讲述,还有一个要注意的问题
    发表于 07-06 11:29

    第27章 FFT的Matlab实现

    (尺寸为5))Y = fft(X,n) 此函数用于返回n的DFT。fft(n)和
    发表于 09-27 08:22

    第28章 ST官方汇编FFT应用

    转dsp系列教程本章主要讲解ST官方汇编FFT的应用,包括1024,256和64FFT
    发表于 09-28 08:08

    第29章 ST官方汇编FFT实现IFFT

    转dsp系列教程本章主要讲解利用ST官方汇编FFT实现IFFT,但由于官方的FFT输入和输出参数都是由信号的实部和虚部两个16位的数据组
    发表于 09-28 08:11

    第32章 实数FFT实现

    转dsp系列教程本章主要讲解实数的浮点和定点Q31,Q15的实现。关于这部分的知识和函数的计算结果上,官方的文档有一些小错误,在章节中会跟大家详细讲述,还有一个要注意的问题,调用实数FFT
    发表于 09-28 09:53

    请问55xx系列TI公司DSPLIB中的fft函数在不修改原程序的前提下最大能做到多少点FFT变换?

    请问一下,55xx系列的DSPLIB调用fft函数最大能做多少点的fft变换?是不是和28系列的一样,在不修改原程序的情况下只能做128-1024
    发表于 07-31 06:49

    HLSFFT的反向输入算法不能实现

    你好, 我想在HLS实现反向输入和自然输出算法。 但是,结果始终是: 我的代码是:void reverse_fft(compnum xin [FFT_SIZE]){ const in
    发表于 03-06 12:48

    ST官方汇编FFT的应用

    第29章 STM32F407移植汇编定点FFT(64,256和1024)本章主要讲解ST官方汇编
    发表于 08-10 08:03

    ST官方汇编FFT的应用

    第29章 STM32F429移植汇编定点FFT(64,256和1024)本章主要讲解ST官方汇编
    发表于 08-11 06:44

    汇编FFT的应用

    第29章 STM32H7移植汇编定点FFT(64,256和1024)本章主要讲解ST官方汇编FF
    发表于 08-17 08:33

    利用固定数组进行256FFT运算的程序

    ,对STM32的硬件和外围设备初始化不再介绍。平台:STM32F103C8T6:标准固件V3.5.0DSP:V.1.4.5单片机内调用的DSP函数为复数
    发表于 08-17 07:24

    如何使用STM32F103汇编实现FFT

    FFT是什么?FFT是怎样提出来的?如何使用STM32F103汇编实现FFT呢?
    发表于 11-15 07:12

    利用FFT IP Core实现FFT算法

    利用FFT IP Core实现FFT算法 摘要:结合工程实践,介绍了一种利用FFT IP Core实现
    发表于 01-16 10:04 6727次阅读
    利用<b class='flag-5'>FFT</b> IP Core<b class='flag-5'>实现</b><b class='flag-5'>FFT</b>算法

    fft原理及实现

    FFT是一种DFT的高效算法,称为快速傅立叶变换(fast Fourier transform)。FFT算法可分为按时间抽取算法和按频率抽取算法,先简要介绍FFT的基本原理。从DFT运算开始,说明
    发表于 12-19 16:18 203次下载

    调用HLSFFT实现N点FFThls:fft

    HLS中用C语言实现8192点FFT,经过测试,实验结果正确,但是时序约束不到100M的时钟,应该是设计上的延时之类的比较大,暂时放弃这个方案
    的头像 发表于 07-07 09:08 1034次阅读
    <b class='flag-5'>调用</b><b class='flag-5'>HLS</b>的<b class='flag-5'>FFT</b>库<b class='flag-5'>实现</b>N点<b class='flag-5'>FFT</b>(<b class='flag-5'>hls</b>:<b class='flag-5'>fft</b>)