0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Xilinx DSP slices 实现 SDF 流水 FFT Core

C29F_xilinx_inc 来源:互联网 作者:佚名 2017-09-19 11:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

背景:

快速傅里叶变换(FFT)在雷达、通信和电子对抗等领域有广泛应用。近年来随着现场可编程门阵列(FPGA)的飞速发展,与DSP技术相比,由于其并行信号处理结构,使得FPGA能够很好地适用于高速信号处理系统,但是,由于Altera等公司研制的FFT IP核,价钱昂贵,不适合大规模应用,在特定领域中,设计适合于自己领域需要的FFT处理器是较为实际的选择,下面将关注一些关于流水级FFT处理器的一些最新发展。

SDF FFT Core → FPGA DSP slice:

近期,在IEEE VLSI系统专栏学报处有一篇12页的题为“Efficient FPGA Mapping of Pipeline SDF FFT Cores”的新论文即将被发表(在IEEE Xplore可见)。而在这篇论文中作者就如何将一个SDF(single-path delay feedback单路延迟反馈)FFT核映射到Xilinx的全可编程芯片内部的DSP48 slices的可编程逻辑及其他可用的存储资源上进行了深入周密的细节性讨论。尽管这篇论文主要是针对Virtex-4和Virtex-6系列FPGA进行讨论的,但是作者也明确指出,由于Xilinx 7系列和UltraScale/UltraScale+ 系列FPGA与Virtex-6使用相同的slice 架构,所以这种映射其实很容易被推广的。

在论文中,作者详细阐述了Xilinx的产品,主要是从Virtex-4 FPGA开始到Xilinx后来的所有全可编程芯片等多代产品内部的DSP48 slices的一个发展过程:首先,Virtex-4 FPGA系列包含一18X18bit乘法器和48bit累加器的XtremeDSP(DSP48);之后的Virtex-6系列FPGA加入了25x18bit乘法器和48bit累加器的DSP48 slices ;较新的7系列FPGA和Zynq-7000系列SoC则内嵌了25x18bit乘法器和48bit累加器的DSP48 slices;而最强的UltraScale/UltraScale+系列FPGA则包括了27x18bit乘法器和48bit加法器的DSP48E2。除此之外,在Xilinx每一代FPGA的DSP48 slices的发展中都有很多额外的改进,比如时钟率具有较稳定的提高,也正是这么多代产品的不断迭代,才使得现在的DSP48E2 功能更加强大。下图是论文中作者提到的关于DSP48E2 功能实现的细节。

图1 DSP48E2 功能细节

同时,在这片IEEE的论文中还讨论了如何将此FFT核蝶形转换到较少的LUT单元中,而如何有效转换关系到是否可以实现DSP48 preadders的蝶形地址,在实现过程中,通过将有效的数据映射和转换因子存储到BRAM 及分布式存储资源中,有效地完成 radix-2k算法转换因子的共享,此外采用重新定时和流水的方式来缩短实现时间。

虽然这篇博客展示的任何技术都是来自于论文中,读者也可以从IEEE论文网站得到,但是还是会给出论文中的一些结论(以便可以提起您去检索并阅读全文的兴趣):“报告的实现结果表明,相比于之前的有关实现而言,通过利用Virtex-4和Virtex-6内部的DSP48实现一个FFT核,可以使其性能分别提高350%到400%,同时,还可以获得一个更高的混合时钟频率,并且整个实现过程只需要更少的存储资源。这也正好如以前发表过的最好的报告结果一样,都是使用完全一样的架构,使用同Virtex-4完全一样的算法,也体现出这种转换的优势十分明显,所以,为提高性能,可以尝试将架构映射到FPGA硬件结构中来实现。

总结:

在目前的市场中,尤其是一些互联网公司,都开始利用FPGA做硬件加速的实现,不仅是因为FPGA的可用性,更主要的是各大公司都看中了硬件实现软件算法时对整个算法质量的极大提升,这类市场也恰好是我们Xilinx未来竞争的关键点所在。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Xilinx
    +关注

    关注

    73

    文章

    2192

    浏览量

    129916
  • FFT
    FFT
    +关注

    关注

    15

    文章

    452

    浏览量

    62597

原文标题:性能飞升350%~400%!Xilinx DSP slices 实现 SDF 流水 FFT Core

文章出处:【微信号:xilinx_inc,微信公众号:赛灵思】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    泰克示波器FFT功能详解

    在电子信号分析中,频谱分析是揭示信号本质的重要手段。泰克示波器的FFT(快速傅里叶变换)功能,将时域信号转化为频域信息,为工程师提供了洞察信号频率成分的“透视镜”。本文将深入解析泰克示波器FFT功能
    的头像 发表于 09-23 17:52 839次阅读
    泰克示波器<b class='flag-5'>FFT</b>功能详解

    【作品合集】中科昊芯Core_DSC280025C开发板测评

    中科昊芯Core_DSC280025C开发板测评作品合集 产品介绍: Core_DSC280025C核心板使用了昊芯HXS320F28025CRISC-V DSP芯片,该芯片集成了吴芯自主研发
    发表于 09-18 10:52

    Tektronix泰克MDO32示波器FFT功能使用指南

    一、引言 在电子工程与信号分析领域,快速傅里叶变换(FFT)是分析复杂信号频谱特性的核心工具。泰克MDO32示波器作为一款高性能混合域示波器,其内置的FFT功能为用户提供了强大的频谱分析能力,可广泛
    的头像 发表于 08-18 17:02 816次阅读
    Tektronix泰克MDO32示波器<b class='flag-5'>FFT</b>功能使用指南

    FFT快速傅里叶变换——方波及其谐波验证

    FFT傅里叶变换是测试中很常用的一个功能,今天给大家分享一下先给示波器一个方波信号,看下它的参数,加一下频率和幅度值,是一个1MHz、5V的方波信号演示过程我们看一下它的FFT信号是什么样的点击
    的头像 发表于 08-13 17:34 875次阅读
    <b class='flag-5'>FFT</b>快速傅里叶变换——方波及其谐波验证

    DFT算法与FFT算法的优劣分析

    一概述 在谐波分析仪中,我们常常提到的两个词语,就是DFT算法与FFT算法,那么一款功率分析仪/谐波分析仪采用DFT算法或者FFT算法,用户往往关注的是能否达到所要分析谐波次数的目的,而并未考虑两种
    的头像 发表于 08-04 09:30 889次阅读

    STM32多通道FFT运算异常的原因?怎么解决?

    CMSIS-DSP使用多次FFT时,是否需特别注意堆栈或缓存的分配方式? 是否有推荐的多通道FFT结构优化方式(如分时处理、DMA双缓冲配合FFT
    发表于 06-19 06:27

    泰克TBS1102X示波器FFT功能使用指南

    泰克TBS1102X示波器作为电子测量领域的经典设备,其内置的快速傅里叶变换(FFT)功能为工程师和技术人员提供了强大的频域分析能力。通过FFT功能,用户能够将时域信号转换为频谱图,从而精准分析信号
    的头像 发表于 05-26 17:10 781次阅读
    泰克TBS1102X示波器<b class='flag-5'>FFT</b>功能使用指南

    泰克示波器TBS2204B的FFT分析功能设置指南

    在电子测试与信号分析领域,快速傅里叶变换(FFT)是解析信号频域特性的核心工具。泰克示波器TBS2204B作为一款高性能4通道数字示波器,其内置的FFT分析功能可帮助用户深入探索信号的频谱分布、频率
    的头像 发表于 05-16 17:45 941次阅读
    泰克示波器TBS2204B的<b class='flag-5'>FFT</b>分析功能设置指南

    Xilinx Shift RAM IP概述和主要功能

    Xilinx Shift RAM IP 是 AMD Xilinx 提供的一个 LogiCORE IP 核,用于在 FPGA 中实现高效的移位寄存器(Shift Register)。该 IP 核利用
    的头像 发表于 05-14 09:36 831次阅读

    DSP在智能家电领域的应用,涵盖音效处理、语音识别、智能化控制

    结构,配备专门的硬件乘法器,广泛运用流水线操作,并提供特殊的 DSP 指令,可快速实现各类数字信号处理算法。   DSP 在 AI 中的应用及优势​ 尽管 
    的头像 发表于 04-14 00:42 2350次阅读

    GD32G5x3 FFT模块用户指南

    电子发烧友网站提供《GD32G5x3 FFT模块用户指南.pdf》资料免费下载
    发表于 02-07 14:38 2次下载
    GD32G5x3 <b class='flag-5'>FFT</b>模块用户指南

    Vivado Xilinx FFT IP核v9.0使用说明

    一 傅里叶变换FFT 想必大家对傅里叶老人家都不陌生了,网上也有这方面的很多资料。通过FFT将时域信号转换到频域,从而对一些在时域上难以分析的信号在频域上进行处理。在这里,我们需要注意采样频率
    的头像 发表于 01-08 11:33 3141次阅读
    Vivado <b class='flag-5'>Xilinx</b> <b class='flag-5'>FFT</b> IP核v9.0使用说明

    EE-191:利用SHARC DSP SPORTs实现无缝UART

    电子发烧友网站提供《EE-191:利用SHARC DSP SPORTs实现无缝UART.pdf》资料免费下载
    发表于 01-06 14:40 0次下载
    EE-191:利用SHARC <b class='flag-5'>DSP</b> SPORTs<b class='flag-5'>实现</b>无缝UART

    EE-267:在SISD和SIMD SHARC处理器上实现就地FFT

    电子发烧友网站提供《EE-267:在SISD和SIMD SHARC处理器上实现就地FFT.pdf》资料免费下载
    发表于 01-05 09:54 0次下载
    EE-267:在SISD和SIMD SHARC处理器上<b class='flag-5'>实现</b>就地<b class='flag-5'>FFT</b>

    dsp28035中用使用cla来进行fft要怎么配置?

    dsp28035中用使用cla来进行fft,f28035.cmd要怎么配置,假设是adc采样进来的数据要进行fft,那还需要怎么其他的配置
    发表于 12-12 08:27