0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何优化PCIe应用中的时钟分配

电子设计 来源:网友电子设计发布 作者:网友电子设计发布 2021-11-23 11:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Julian Hagedorn

PCI Express® (PCIe®) 是一项业界领先的标准输入/输出 (I/O) 技术,是服务器、个人电脑以及其它应用中最常用的 I/O 接口之一。该标准多年来不断发展,以适应更高的数据速率(见表 1)。第 3 代 PCIe 引入了全新的编码方案,其可在不增加数据速率一倍的情况下,将数据吞吐量提升一倍。PCI-SIG 近期宣布推出的第 4 代 PCIe 具有 16 G 每秒传输 (GT/s) 的比特率。第 4 代的规范预计将在 2014 或 2015 年发布。

poYBAGGKb7-ALitxAABMfU84bTA871.jpg

表 1:各代 PCIe 的数据吞吐量

随着数据速率的提升,参考时钟需求也在不断提高。本文将重点介绍参考时钟需求。

PCIe 参考时钟 (RefClk) 规范可针对 3 种不同架构定义,分别是:数据时钟、独立 RefClk 以及通用 RefClk。每个架构都具有特定的滤波器函数。在接收器时钟数据恢复输入端出现的有效抖动是接收器及发送器 PLL 带宽与 RefClk 抖动频谱所涉及峰值之差的函数。此外,它还取决于 RefClk 架构。

在独立 RefClk 架构中,发送器 (TX) 与接收器 (RX) 都可接收独立的 RefClk。这会导致严格的抖动需求,而且不能应用扩展频谱时钟 (SSC)。

在数据时钟架构中,单个 RefClk 可连接至发送器,而接收器则使用来自数据流的嵌入式时钟信号。时钟数据恢复 (CDR) 电路可提取数据流中的时钟。它最大限度地缓解了抖动要求,而且也可应用 SSC。但是,这是一种相对较新的标准,很多器件都不支持。

最佳备选标准(也是最常用的标准)是通用 RefClk 架构。它不仅可向发送器与接收器提供相同的 RefClk,而且还支持可减少电磁干扰 (EMI) 的 SSC,其实施非常便捷。这种架构的缺点是 RefClk 需要满足不足 12ns 的偏移需求。下列是通用 RefClk 架构及其应用实例。

pYYBAGGKb8KAd8OXAAA5Xb4cjpk546.jpg

表 2:应用滤波器函数后的通用 RefClk 抖动规范

服务器卡等通用 PCIe 应用包含几个构建块。系统的核心是根联合体,其代表 I/O 系统的根。根联合体连接 CPU 和存储器,可能具有多个 PCIe 端口。此外,它还包含开关和 PCIe 端点(例如显卡)。I/O 系统的所有组件都要符合发送器/接收器与 RefClk 的抖动要求。如果所有构建块都兼容于第 3 代 PCIe,那么都要达到 1ps rms 的 RefClk 要求(图 1)。

pYYBAGGKb8WASm2EAAC8t9mGNUg726.jpg

图 1:解决方案 1:支持第 3 代 PCIe 通用 RefClk 抖动限制的服务器卡实例

图 1 所示系统可使用一个 7 输出时钟生成器实现。这种实施方案最终可能需要一个以上基于时钟生成器的时钟树解决方案,因为还需要生成其它系统时钟。系统时钟生成器可为千兆位以太网器件、SATA 控制器DDR 时钟等生成参考时钟。在图 2 中,RefClk 生成器由时钟缓冲器取代。这不仅可简化时钟树,而且还可提供成本更低、空间更优化的解决方案。

poYBAGGKb8mAJtvfAAAnLPBR0i8295.jpg

表 3:解决方案 1 与解决方案 2 以及空间与成本的对比

pYYBAGGKb8uAY3dhAAC73cOESq0073.jpg

图 2:解决方案 2:使用 LMK00338 等 RefClk 缓冲器的服务器卡实例

在使用缓冲器分配 RefClk 时,需要考虑缓冲器引起的附加抖动。附加抖动的定义是器件本身对输入信号产生的额外抖动量,计算方法是:poYBAGGKb86APMz_AAAKwu6n2f0754.jpg

假设噪声过程是随机的,而且输入噪声与输出噪声无关。缓冲器的抖动输出可通过该公式计算:poYBAGGKb9GAbiejAAAOsyeZ_wY036.jpg

LMK00338 是一款超低附加抖动 PCIe 时钟缓冲器。对于第 3 代 PCIe 应用而言,一般具有 30fs rms 的附加抖动。表 3 是应用不同 PCIe 滤波器函数时的附加抖动性能。

pYYBAGGKb9aAfWm5AABFqdEw5Q8010.jpg

表 4:LMK00338 的附加抖动性能

CDCM6208 等第 3 代 PCIe 高性能时钟生成器可提供具有 160.66fs rms 抖动(2MHz 至 5MHz 滤波器)的 RefClk。如果对该时钟进行分配,LMK00338 会向 RefClk 信号增加 25fs rms 的抖动。使用以上计算公式计算出的输出抖动仅为 162.54 fs rms(表 5)。在最坏的情况下,RefClk 生成器可能具有 999fs rms 的抖动,使用 LMK00338 不会超出第 3 代 PCIe 的抖动限值。

表 5 是未应用 PCIe 滤波器函数时 LMK00338 的附加抖动性能。由于具有 77 fs rms 的低附加抖动(集成带宽:12kHz 至 20MHz),因此该缓冲器适用于大部分使用 HCSL 信号传输技术的高性能时钟应用。另外还提供更小的 4 输出版本。

poYBAGGKb9mAA3KuAABuf4blM00276.jpg

表 5:低抖动 RefClk 源 (CDCM6208) 驱动的时钟缓冲器的效果。

多个服务器卡中存在的共同问题是电源噪声问题。噪声可能来自多个噪声源,首先是开关电源,以及 CPU、ASICFPGA数字电路。电源旁路将帮助过滤掉其中一部分噪声,而剩下的噪声则将影响器件性能。在剩余噪声影响时钟分配器件电源时,会导致窄带相位调制以及时钟输出的幅度调制。

在 100kHz 至 10MHz 的噪声频率范围内,LMK00338 可在 100MHz 输出频率下表现出低于 -75dBc 的优异电源纹波抑制 (PSRR) 特性。这种噪声抗扰度将帮助简化电源旁路,是 LMK00338 的另一大重要优势。

以上分析表明,只要 RefClk 生成器符合抖动要求,就可以放心大胆地在通用 RefClk 系统中使用超低附加抖动时钟缓冲器。

此外,LMK00338 的通用输入级不仅可接收任何差分或单端信号,而且还可将其转换为 8 HCSL 输出。对于第 4 代 PCIe 而言,最大 RefClk 抖动可假定为远远小于 1ps rms。因此,支持缓冲的通用 RefClk 架构将更适合更严格的较新 PCIe 标准。

如欲了解有关时钟产品的更多详情,敬请查看时钟及定时解决方案指南。

原文请参见: http://e2e.ti.com/blogs_/b/analogwire/archive/2014/03/28/how-to-optimize-clock-distribution-in-pcie-applications.aspx

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7314

    浏览量

    93983
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90884
  • 时钟
    +关注

    关注

    11

    文章

    1953

    浏览量

    134544
  • PCIe
    +关注

    关注

    16

    文章

    1421

    浏览量

    87550
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一文搞懂 RK3588 PCIe:从硬件资源到拆分配置 + 避坑指南(含脑图)

    与  PHY  对应关系   RK3588  的控制器与  PHY  绑定存在固定规则,拆分配置前需明确对应关系:     • pcie3x4 ( 4Lane ) :仅
    的头像 发表于 11-20 18:18 1819次阅读
    一文搞懂 RK3588 <b class='flag-5'>PCIe</b>:从硬件资源到拆<b class='flag-5'>分配</b>置 + 避坑指南(含脑图)

    时标分配器、时间信号分配器、时钟分配

    时钟分配仪器仪表
    西安同步电子科技有限公司
    发布于 :2025年10月22日 10:40:51

    电力系统该用哪种同步时钟

    时钟分配仪器仪表
    西安同步电子科技有限公司
    发布于 :2025年10月22日 10:39:50

    ‌Microchip SYA7560系列PCIe时钟缓冲器技术总结

    Microchip Technology SYA7560 PCIe时钟缓冲器的最低抖动可达10fs (PCIe 5.0)、20fs (PCIe 3.0/4.0) 和52fs(12kH
    的头像 发表于 10-14 15:15 318次阅读
    ‌Microchip SYA7560系列<b class='flag-5'>PCIe</b><b class='flag-5'>时钟</b>缓冲器技术总结

    时钟设计优化实战

    1、时钟设计,芯片性能的节拍器 在现代 IC 设计时钟网络的优化是实现高性能、高可靠性和低功耗的关键。本文聚焦四大核心技术:CTS 优化
    的头像 发表于 10-09 10:07 290次阅读

    PCIe Gen7时钟缓冲技术解析:TI CDCDB400芯片深度剖析

    Texas Instruments CDCDB400 4路输出时钟缓冲器是一款符合DB800ZL标准的4路输出LP-HCSL时钟缓冲器,能够为PCIe Gen 1-5、QuickPath
    的头像 发表于 10-06 15:28 1116次阅读
    ‌<b class='flag-5'>PCIe</b> Gen7<b class='flag-5'>时钟</b>缓冲技术解析:TI CDCDB400芯片深度剖析

    Texas Instruments CDCDB803用于PCIe®第1代至第5代的8输出时钟缓冲器数据手册

    Texas Instruments用于PCIe^®^ Gen 1至Gen 5的CDCDB803 8输出时钟缓冲器是符合DB800ZL标准的时钟缓冲器,用来为PCIe Gen 1 - 5
    的头像 发表于 09-26 15:14 514次阅读
    Texas Instruments CDCDB803用于<b class='flag-5'>PCIe</b>®第1代至第5代的8输出<b class='flag-5'>时钟</b>缓冲器数据手册

    ‌LMK00338 8-Output PCIe时钟缓冲器与电平转换器技术文档总结

    LMK00338器件是一款 8 输出 PCIe Gen1/Gen2/Gen3/Gen4/Gen5 扇出缓冲器,用于高频、低抖动时钟、数据分配和电平转换。输入时钟可以从两个通用输入或一个
    的头像 发表于 09-15 09:17 445次阅读
    ‌LMK00338 8-Output <b class='flag-5'>PCIe</b><b class='flag-5'>时钟</b>缓冲器与电平转换器技术文档总结

    NVMe高速传输之摆脱XDMA设计22:PCIe的TLP读优化处理

    实际应用环境,由于队列、PRP、数据的存储往往在不同的位置,因此完成读取过程的延时也不同,在本课题中,将队列管理与PRP都放置在了近PCIe端存储,因此读取队列与PRP的延时远远小于读取数据的延时
    发表于 08-19 08:48

    PCIe协议分析仪在数据中心中有何作用?

    升数据中心的整体可靠性。以下是其核心作用及具体应用场景的详细分析:一、性能优化:突破带宽瓶颈,提升计算效率 链路带宽利用率分析 场景:在AI训练集群,GPU通过PCIe与CPU交换数据,若带宽利用率低
    发表于 07-29 15:02

    PCIe协议分析仪能测试哪些设备?

    场景:监测GPU与主机之间的PCIe通信,分析数据传输效率、延迟和带宽利用率。 应用价值:优化大规模AI训练任务的数据加载和模型参数同步,例如在多GPU系统测试PCIe交换机的性能和
    发表于 07-25 14:09

    nvme IP开发之PCIe

    配置空间 管理PCIe总线。PCI配置空间头分为Type0和Type1两种类型,Type0类型配置空间 头在PCIe总线中用于EP,Type1类型配置空间头用于Switch的虚拟PCI桥。 Type0
    发表于 05-18 00:48

    Diodes公司PCIe 6.0时钟缓冲器介绍

    PI6CB3320xxA 系列为 PCIe 6.0 时钟缓冲器,具有 20、16、13、12、8 和 4 通道低功耗 HCSL 输出,具有 85Ω或 100Ω输出阻抗的片上终端 (On-Chip Termination)。
    的头像 发表于 04-10 15:49 893次阅读
    Diodes公司<b class='flag-5'>PCIe</b> 6.0<b class='flag-5'>时钟</b>缓冲器介绍

    时钟缓冲器工作原理及常见时钟缓冲器的国产替代情况

    时钟缓冲器是一种用于生成、处理和分配时钟信号的电子电路,主要用于确保数字系统各模块的同步操作。其核心功能是对输入时钟信号进行调理和
    的头像 发表于 02-17 14:34 1948次阅读