0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何合理优化FPGA架构设计及配方法

e9Zb_gh_8734352 来源:未知 作者:龚婷 2018-03-20 11:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如果符合一些简单的设计原则,采用最新的Xilinx7系列FPGA架构上实现无线通信。Xilinx公司已经创建了典型无线数据路径的设计范例,表明中速级(-2)器件上使用的几乎100%的 slice资源都支持500 MHz以上的时钟频率。如何真正时序高速设计,需要注意一下几点

影响时钟频率的基本规则

01

DSP48 slice数与时钟速率成反比

一般来说DSP48 slice数与时钟速率成反比。Block RAM资源也按照阶跃函数随时钟速率降低。这在无线电信号处理设计中较常见,其中Block RAM基本上用来按照相对高的采样率存储大量函数运算的系数集合,例如,DDS(直接数字合成器)的正弦/余弦值,峰值抵消脉冲产生器中的CFR (波峰因数衰减)系数,或DPD (数字预失真)模型中的非线性函数抽样。

所以,提供时钟频率能够降低Slice和BlockRAM的资源利用,当时钟频率从368.64转换至491.52 MHz(1.33时钟比) ,按照比例LUT和FF的数据量分别减少了1.34和1.44倍。将时钟速率从245.76放大一倍至491.52 MHz,这些数据减少了1.8倍和1.7倍。这种非线性行为基本上是为执行信号处理控制逻辑,不需要按照时钟频率进行线性放大。

02

信号采样率也影响资源利用率

采样速率为25 Msamples/sec的滤波器带宽在250 MHz运行时与带宽在500 MHz运行时相比所需的逻辑资源略降低两倍。采样速率为500 Msamples/sec的多相实现带宽在250 MHz运行时与带宽在500 MHz时相比,所需的逻辑资源增加两倍。对逻辑资源使用的一阶估计是时钟频率增加x倍相当于逻辑利用率减少0.85至1.1倍

高速设计其他注意事项

01

流水线设计

适当的流水线程序当然是设计高速程序的关键因素,所有的高速设计都推崇流水线设计,在此不做详细描述

02

合理使用BlockRAM

需要构建一个以上Block RAM的存储时,可通过选择最大限度地减少数据复用和资源利用的配置优化速度。举例来说, 存储16位数据的16K存储器最好使用16K × 1位的Block RAM进行构建,而不是1K × 16位的Block RAM.

03

正确使用DSP Slice

DSP slice逻辑本质上可支持较高的时钟速率。逻辑电平与数据路由路径的数量限制了速度,因此在构建高速设计时应在每一个或两个LUT电平上插入一个寄存器

04

合理的层次结构

定义合理的层次结构,按照逻辑分区将设计划分成相应的功能模块。这种层次结构提供便于在层次边界寄存输出的方法,从而限制特定模块的关键路径。这样分析和修复在单一模块中定位的时序路径就很容易。实际上,定位超高时钟速度时,应在层次结构的一些层级使用多个寄存器级,以优化时序并为后端工具留下更多设计空间。好的设计层次结构应该将相关的逻辑集成在一起,使得区域分组和逻辑压缩更为有效;

建立适当的层次结构可在多个模块时获取可重复结果

在模块级应用实现属性,可令代码简单并具可扩展性,该属性可传播该模块中声明的所有信号

05

良好的时钟管理和时钟分配方法

尽可能减少独立主时钟数量

将时钟元件放在设计层次结构的顶层,以便在多个模块共享时钟,这将减少所需的时钟资源,提高时序性能,并降低资源和功率利用率

在不相关时钟域之间使用适当的再同步技术

限制时钟“使能”的使用。实际上这条规则难以实现,原因是在多周期实现中时钟“使能”通常需要评估数据样本或操作符输出。实现有效的降低功耗技术很有效。在任何情况下,必须适当寄存时钟使能信号以删除高扇出 nets

06

复位策略

最小化复位网络的大小

避免全局复位。

优选同步复位,实际上对DSP48逻辑片和Block RAM是强制的。

总结

高速设计时FPGA设计的未来,随着信号处理能力的增强,FPGA高速设计必不可少。如何合理优化FPGA架构设计是我们必须要考虑的问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1656

    文章

    22298

    浏览量

    630455
  • 时钟
    +关注

    关注

    11

    文章

    1953

    浏览量

    134561
  • 无线电信号
    +关注

    关注

    1

    文章

    50

    浏览量

    13135

原文标题:高速FPGA系统设计几条军规

文章出处:【微信号:gh_873435264fd4,微信公众号:FPGA技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    数字IC/FPGA设计中的时序优化方法

    在数字IC/FPGA设计的过程中,对PPA的优化是无处不在的,也是芯片设计工程师的使命所在。此节主要将介绍performance性能的优化,如何对时序路径进行优化,提高工作时钟频率。
    的头像 发表于 12-09 10:33 2574次阅读
    数字IC/<b class='flag-5'>FPGA</b>设计中的时序<b class='flag-5'>优化</b><b class='flag-5'>方法</b>

    基于DSP与FPGA异构架构的高性能伺服控制系统设计

    DSP+FPGA架构在伺服控制模块中的应用,成功解决了高性能伺服系统对实时性、精度和复杂度的多重需求。通过合理的功能划分,DSP专注于复杂算法和上层控制,FPGA处理高速硬件任务,两者
    的头像 发表于 12-04 15:38 153次阅读
    基于DSP与<b class='flag-5'>FPGA</b>异构<b class='flag-5'>架构</b>的高性能伺服控制系统设计

    怎样优化电能质量在线监测装置的网络传输?

    的应用场景(如工业车间、户外光伏、电网关口)匹配方案。以下是具体可落地的优化方法: 一、优先选对传输介质:从源头降低延迟与丢包 传输介质是网络传输的基础,不同介质的延迟、带宽、抗干扰能力差异极大,需根据场景选择 “高稳定、
    的头像 发表于 10-23 11:52 145次阅读

    FPGA+DSP/ARM架构开发与应用

    自中高端FPGA技术成熟以来,FPGA+DSP/ARM架构的硬件设计在众多工业领域得到广泛应用。例如无线通信、图像处理、工业控制、仪器测量等。
    的头像 发表于 10-15 10:39 3703次阅读
    <b class='flag-5'>FPGA</b>+DSP/ARM<b class='flag-5'>架构</b>开发与应用

    FPGA测试DDR带宽跑不满的常见原因及分析方法

    FPGA 中测试 DDR 带宽时,带宽无法跑满是常见问题。下面我将从架构、时序、访问模式、工具限制等多个维度,系统梳理导致 DDR 带宽跑不满的常见原因及分析方法
    的头像 发表于 10-15 10:17 586次阅读

    TensorRT-LLM的大规模专家并行架构设

    之前文章已介绍引入大规模 EP 的初衷,本篇将继续深入介绍 TensorRT-LLM 的大规模专家并行架构设计与创新实现。
    的头像 发表于 09-23 14:42 721次阅读
    TensorRT-LLM的大规模专家并行<b class='flag-5'>架构设</b>计

    在TR组件优化与存算一体架构中构建技术话语权

    一、技术纵深:从模块化开发到架构设计的能力跃迁1.1 射频前端技术演进与能力认证 在5G毫米波频段下,TR组件的性能直接决定了通信系统的灵敏度。当前业界领先的解决方案是通过: 砷化镓(GaAs
    发表于 08-26 10:40

    深入剖析RabbitMQ高可用架构设

    在微服务架构中,消息队列故障导致的系统不可用率高达27%!如何构建一个真正可靠的消息中间件架构?本文将深入剖析RabbitMQ高可用设计的核心要点。
    的头像 发表于 08-18 11:19 711次阅读

    基于数据算法驱动的配方研发新模式

    基于数据算法驱动的配方研发新模式 随着人工智能、大数据和机器学习技术的快速发展,传统依赖经验和试错的配方研发模式正逐步向数据驱动、算法优化的智能化模式转型。这种新模式通过整合多维度数据、构建预测模型
    的头像 发表于 08-06 17:25 802次阅读

    中型数据中心中的差分晶体振荡器应用与匹配方

    : Spine-Leaf架构交换网络(如BCM/Marvell平台)、GPU集群、100G NIC卡、并行文件系统、FPGA平台、CDR链路模块。 3. 企业级核心业务机房 应用背景: 运行ERP、CRM、OLTP系统等
    发表于 07-01 16:33

    SOA架构开发小助手PAVELINK.SOA-Converter 2.1.2新版本发布

    为提升汽车SOA架构设计开发效率,优化用户体验,我们对PAVELINK.SOA-Converter进行了全新升级。本次2.1.2新版本升级,聚焦于提升软件性能、扩展功能特性及增强用户交互体验。
    的头像 发表于 04-09 10:37 1264次阅读
    SOA<b class='flag-5'>架构</b>开发小助手PAVELINK.SOA-Converter 2.1.2新版本发布

    MRAM存储替代闪存,FPGA升级新技术

    优化架构设计和成熟的制程技术,具备内置的硬擦除器、错误检测和校正机制,为用户提供了可靠的开发环境。用户可利用最新的Radiant工具,直接实现MRAM的编程接口,支持多种存储容量和数据速率。利用这些FPGA器件,用户可以受益于
    发表于 03-08 00:10 1650次阅读

    芯片架构设计的关键要素

    芯片架构设计的目标是达到功能、性能、功耗、面积(FPA)的平衡。好的芯片架构能有效提升系统的整体性能,优化功耗,并确保在成本和时间的限制下完成设计任务。
    的头像 发表于 03-01 16:23 1434次阅读

    如何优化 CPLD 性能

    CPLD(复杂可编程逻辑器件)是一种介于简单PLD(可编程逻辑器件)和FPGA(现场可编程门阵列)之间的可编程逻辑器件。它们通常用于实现中等复杂度的数字电路设计。优化CPLD性能可以通过以下几个方面
    的头像 发表于 01-23 10:03 1117次阅读

    焊接技术流程优化方法

    焊接是现代制造业中不可或缺的一部分,广泛应用于建筑、汽车、航空、船舶等领域。随着科技的发展,对焊接技术的要求越来越高,优化焊接流程显得尤为重要。 1. 焊接工艺的优化 1.1 选择合适的焊接方法
    的头像 发表于 01-19 13:52 1893次阅读