0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

下一代PCIe5.0 /6.0技术热潮趋势与测试挑战

ElectroRent 来源:ElectroRent 作者:ElectroRent 2024-03-06 10:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大模型时代已经到来,AI大模型技术快速成熟,进入万亿参数时代,对于AI算力性能要求越来越高,表现为计算系统的节点内卡间互联与节点间的网络互联,高速互联的底层是PCIe,对于PCIe的技术迭代和落地迫切。

一、PCIe 5.0 /6.0技术升级

1)信号速率方面

从PCIe 3.0、4.0、5.0 到 6.0,数据速率翻倍递增,6.0支持64GT/s,16路双向传输带宽可达256GB/s。

wKgaomXn1m2ABkEBAACPbvv-FLE77.webp

图1:PCIe技术变化2)调制格式方面

PCIe 3.0-5.0 都采用NRZ调制格式,在PCIe 6.0时首次采用高阶调制格式PAM4,在信号幅度相同的情况下信噪比天然会下降约9.5dB,因此对噪声更加敏感(比如电源噪声、串扰、反射等),为降低该影响,采用了格雷码映射(MSB,LSB),如下展示了格雷码映射的PAM4眼图,在噪声影响下,低比特LSB更易引起反转导致出错,若噪声幅度较高,也会引起2bit反转,但概率较低。

wKgZomXn1m6ABRJ5AABHnG55OTY82.webp

图2:PAM4 眼图

3)收发架构方面

为支持PAM4调制格式,通常采用DAC产生信号,ADC接收信号,发送侧为克服传输链路影响,通常会用多抽头的FIR实现,PCIe 6.0采用4抽头的FIR,接收侧为补偿高频损耗和多比特码间干扰会用到CTLE+DFE,当前架构会利用DSP技术根据ADC模数转换的数据点实现数字域处理,该技术也可以有效克服PVT的变化对信号带来的影响。

4)编码与数据流方面PCIe 3.0-5.0 均采用128b/130b编码方式,相比PCIe 1.0-2.0 降低了开销提高了编码效率,默认支持Non-Flit流模式,PCIe 6.0采用1b/1b编码并且必须支持Flip流模式。Non-Flit模式支持可变大小TLP、4字节CRC用于TLP、2字节CRC用于DLLP。而Flit模式则支持256字节固定长度包括235字节TLP、6字节DLP、8字节CRC 和6字节FEC,没有Sync Header/Framing Token,TLP 和DLLP 没有独立的CRC,通过这些开销的优化相对提高了带宽利用率。

wKgaomXn1m6AQAEmAABT0GYU9fE85.webp

图3:PCIe速率、Flit、编码等特点

5)互连通道及连接器方面

PCIe 5.0~6.0 相比PCIe 1.0~4.0 速率高,SI、PI 要求也有提高。电源方面,插卡最大功耗可提升至600W,将 在 6.0 CEM中更新;信号方面为保证信号完整性要求使用表贴连接器;互连通道方面,与PCIe 5.0类似,要求主板支持约12 inch,插卡支持约3-4 inch,可以想象下,如果PCIe 6.0仍旧采用NRZ调制格式,64GT/s速率奈奎斯特频点在32GHz,那 么 通 道 IL将小于-60dB(参考下图通道仿真结果),很难通过现有技术实现该信号的高频补偿,考虑实现成本和技术复杂度,采用高阶调制PAM4是种不错选择,相比PCIe 5.0奈奎斯特频率不变,当前可用板材下可传输相似距离。

wKgZomXn1m-AOGh9AAA_Rs-v7xc13.webp

图4:不同信道插损仿真图

6)误码率方面PCIe 3.0~5.0 均要满足1E-12,PCIe 6.0 由于采用PAM4,对噪声和反射更敏感,结合格雷码映射特点(易发生单bit 错 误 ), 接 收 侧 会 关 注 first bit error,规范会用FBER衡量。由于链路接收机会用到DFE均衡,若有单bit出错,它这会引起后续接连出错。如果造成误码的源是共有的,比如电源噪声,那么也会引起其他lane出错,系统BER依赖于FBER和lane间的错误相关性。规范定义了FBER是1E-6,那么为什么是1E-6呢?能否放宽至1E-4, 满足PCIe 5.0通常的传输距离或IL目标呢?答案是否定的。参考以太网标准放宽至1E-4,需要使用复杂RS-FEC 纠错,延时将增加到约100ns量级,这对负载和存储等对时延敏感的应用是一个很大的挑战。一旦确定FEC技术将应用至整个PCIe 6.0的生命周期,传输通道优化还有其他更多手段,比如更新板材,更复杂信号调理等。为满足FBER=1E-6目标,PCIe 6.0引入轻量级FEC和鲁棒性强的CRC算法实现修正和错误检测。相比100G/400G以太网标准中经常用到的RS(544,514), 该 FEC实现相对简单,在固定包长度Flit模式下,6字节的FEC“保护”242字节Payload和8字节CRC,2字节1组实现FEC Group通过交织方式抵抗突发错误。如果FEC解码完成,但CRC仍检测到错误,那么接收侧会发送NAK启动重传,为提高效率,该模式下不会重传NOP-only TLP 包。通过上述FEC、CRC适配FBER=1E-6 要求,同时保证出错情况下重传概率在5E-6、带宽额外消耗约0.05%、FIT接近0。

wKgaomXn1nCAM1ZnAACC0qevBzw86.webp

图5:展示PCIe 6.0的重要变化

二、PCIe 6.0 测试测量挑战

1)PCIe 6.0 规范状态

当前PCIe 6.0 Base spec v1.0 已经发布,CEM Spec 和Phy Test Spec 还在讨论中。

2)Tx 信号完整性方面

相比PCIe 5.0,PCIe 6.0新增了SNDR、RLM、JnU、Jrms 和Preset 测试。

wKgZomXn1nCAWGgOAABX7j6N_eg41.webp

图6 PCIe 6.0 Tx 测试参数变化

3)Rx接收误码率方面在16G、32G和64GT/s接收校准时RJ不再是主要调节目标EH/EW的参数,通过信道自身插损调节实现粗调,SJ/DMSI 实现细调,综合实现目标EH/EW。Rx Reference Package的S参数模型是嵌在示波器中实现的,通过TP2端面信号测量和嵌入S参数的计算并结合参考的CTLE+DFE/CDR得到TP2P EH和EW。这里的EH和EW是目标PAM4眼图的Top Eye 参 数( 6mV EH / 0.1 UI EW @1e-6 BER)。目 前Sigtest 还未发布,校准时采用seasim 作为数据处理工具。

wKgaomXn1nGAc08NAAAl2msf-cc19.webp

图7:PCIe 6.0芯片Rx校准

64GT/s 接收测试时,无论是芯片还是 CEM,通常需要进行链路训练进入loopback,才能完成误码率测试。能 否支持更高速率切换、能否支持对噪声敏感的NRZ/PAM4格式切换都是挑战,另外是否支持SSC和FEC解码 挑战更大。为消除环回channel对误码率影响,可以利用外置Redriver及内部自适应均衡配合实现。

wKgZomXn1nGAUwxfAAAfVO-BpBA26.webp

图8:PCIe 6.0芯片Rx测试

4)互连通道方面端到端链路包括封装、PCB布线、连接器、过孔、耦合电容等,和PCIe 5.0相比有所变化,参考下图,其一体现在端到端IL限制到了-32dB,其二体现在RC 的IL限制到了-7.9dB,EP的IL限制到-4.1dB,链路相关插损仍旧需要使用20GHz网分实现标定。

wKgaomXn1nOAK3m9AAB1hL_SJcI88.webp

图9:PCIe 5.0/6.0 端到端损耗比较

5)参考时钟方面共时钟架构下PCIe 6.0参考时钟抖动在100fs(rms),相比PCIe 5.0参考时钟抖动limit下降了67%,这对测试测量带来挑战,要求仪器固有抖动不能太高。在信道仿真时考虑实际系统噪声影响,抖动limit可放宽至0.15ps(rms)。

wKgZomXn1nOAKjaIAAAyhotDUnM89.webp

图10:参考时钟抖动要求

三、PCIe 6.0 测试方案

是德科技可以提芯片、板卡和产品的整体测试方案。包括仿真、调试和一致性测试等。

wKgaomXn1nSAaxUKAACxxoxW8ng48.webp

图11:整体测试方案

1) 物理层方面

参考PCIe 6.0 Base spec v1.0,要求使用 33GHz 带 宽( Bessel滤波器)进行发送一致性测试, 等效最大平坦度 响应带宽是50GHz,这里推荐UXR0504A示波器。UXR系列示波器集成了InP材料HB2C工艺实现的前置放 大 器( 可达 110GHz)、 10 bit 高性能ADC和硬件加速功能的ASIC芯片,实现了4通带全带宽。通过工艺、芯 片和封装技术使得UXR具备低本底噪声、低固有抖动/通道间抖动和高耐压。它无需外接衰减器就可以实现 PCIe 6.0 serdes 信号高保真度测试。

wKgZomXn1nSAP2NtAABYOjBcmxA00.webp

图12:UXR示波器主要型号和参数

2)协议层方面

芯片回片或板卡回板后完成bring up,除物理电气子层测试还外,还需验证逻辑子层LTSSM链路状态机以及数据 链 路 层 、事 务 层 等 业 务 是 否 正 常 及 合 规 性 ,那 么 还 需 要 借 助 协 议 分 析 仪 或 训 练 器 。当 前 已 经 发 布 了 支 持 PCIe 5.0的P5551A和P5552A的训练器和分析仪产品,支持不同link宽度,该产品集成interposer采集和数据处理功能于一体,无需一堆外部长线缆将信号传给主机处理,保证了信号完整性。分析仪注重协议解析、链路监控及数据过滤等,训练器重点在于模拟对端EP或RC完成数据通信、支持注错和重播等,未来有计划通过升级支持PCIe 6.0、CXL、NVMe等协议。

总之,是德科技可以提供基于ADS仿真、PLTS信号测量、物理层收发、插卡环路带宽分析及协议分析等综合解决方案。

wKgaomXn1nWAaEE2AACzsDiRZLE61.webp

图13:PCIe 6.0 仿真、互连、物理层一致性和协议分析方案

文章来源:是德科技

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40982

    浏览量

    302534
  • 是德科技
    +关注

    关注

    21

    文章

    1072

    浏览量

    85719
  • PCIe5.0
    +关注

    关注

    0

    文章

    37

    浏览量

    2002
  • 大模型
    +关注

    关注

    2

    文章

    3753

    浏览量

    5268
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PCIe 6.0 连载 · 上篇】64GT/s 时代来临:AI与算力爆发下的高速互联新基石

    决定系统能发挥多少性能。当PCIe5.0刚刚进入普及阶段,PCIe6.0已经正式登场。它以64GT/s的传输速率、x16通道双向256GB/s的带宽,为下一代算力基
    的头像 发表于 04-08 17:34 282次阅读
    【<b class='flag-5'>PCIe</b> <b class='flag-5'>6.0</b> 连载 · 上篇】64GT/s 时代来临:AI与算力爆发下的高速互联新基石

    ICY DOCK PCIe5.0存储扩展三件套深度评测 实测满速无损传输

    、阻抗匹配、电磁干扰极度敏感,传统抽取方案常因信号衰减导致速率骤降或链路中断。ICYDOCK以系统级工程思维破局,推出端到端协同优化的PCIe5.0存储扩展三件套
    的头像 发表于 02-12 17:02 5319次阅读
    ICY DOCK <b class='flag-5'>PCIe5.0</b>存储扩展三件套深度评测 实测满速无损传输

    128Gbps满血释放:PCIe5.0 商用存储全场景落地,ICY DOCK 全系产品深度解析

    在数据量爆发式增长与算力需求持续升级的背景下,PCIe5.0作为新一代高速互连标准,凭借32GT/s单通道传输速率、四通道构型双向128Gbps单盘理论带宽的核心优势,突破传统存储带宽瓶颈,成为
    的头像 发表于 02-07 11:00 1051次阅读
    128Gbps满血释放:<b class='flag-5'>PCIe5.0</b> 商用存储全场景落地,ICY DOCK 全系产品深度解析

    设计下一代AI SSD,如何选对PLP电容?

    随着OpenAI掀起的大模型浪潮,以英伟达Blackwell架构为代表的新型AI数据中心正处于爆发式部署阶段。这种全球规模的算力基础设施扩容,对PCIe5.0/6.0企业级SSD的吞吐性能、极端环境
    的头像 发表于 01-09 14:15 478次阅读
    设计<b class='flag-5'>下一代</b>AI SSD,如何选对PLP电容?

    VIAVI PCI Express5.0 Xgig协议训练器主机测试台专为 PCIe 5.0 适配器卡及控制器/固件开发的体化测试方案

    PCIE5.0协议训练器主机测试台专为适配器卡及其控制器/固件开发设计的体化测试解决方案。设计用于开发、协调和性能调谐PCIe适配卡及其控
    的头像 发表于 12-24 16:09 277次阅读
    VIAVI PCI Express<b class='flag-5'>5.0</b> Xgig协议训练器主机<b class='flag-5'>测试</b>台专为 <b class='flag-5'>PCIe</b> <b class='flag-5'>5.0</b> 适配器卡及控制器/固件开发的<b class='flag-5'>一</b>体化<b class='flag-5'>测试</b>方案

    VIAVI Xgig 5P16推出全新功能,完善PCIe5.0测试需求

    VIAVI Xgig 5P16推出全新功能,完善了PCIe5.0测试需求。Xgig 5P16分析仪/协议训练器提供16通道全速数据捕获和错误注入,可对PCIe协议进行详细的功能和性能分析。
    的头像 发表于 12-17 16:25 451次阅读
    VIAVI Xgig 5P16推出全新功能,完善<b class='flag-5'>PCIe5.0</b><b class='flag-5'>测试</b>需求

    Amphenol PCI Express® Gen 6 卡边缘连接器:下一代系统的高速解决方案

    至关重要。Amphenol 的 PCI Express® Gen 6 卡边缘连接器正是顺应这趋势的产物,为下一代系统提供了高达 64GT/s 的差分信号传输能力。 文件下载: Amphenol FCI
    的头像 发表于 12-10 15:25 732次阅读

    Amphenol PCIe® Gen 6 Mini Cool Edge IO连接器:下一代高速互连解决方案

    Amphenol PCIe® Gen 6 Mini Cool Edge IO连接器:下一代高速互连解决方案 在高速互连领域,Amphenol推出的PCIe® Gen 6 Mini Cool Edge
    的头像 发表于 12-10 11:10 654次阅读

    罗德与施瓦茨携手博通打造下一代Wi-Fi 8设备测试解决方案

    罗德与施瓦茨(以下简称“R&S”)CMP180无线通信测试仪已通过博通公司的验证,适用于下一代Wi-Fi 8设备的全面、前瞻性测试解决方案。此次合作通过预置测试例程和提前获取关键资源,
    的头像 发表于 12-02 09:55 2184次阅读

    Microchip推出下一代Switchtec Gen 6 PCIe交换芯片

    随着人工智能(AI)工作负载和高性能计算(HPC)应用对数据传输速度与低延迟的需求持续激增,Microchip Technology Inc.(微芯科技公司)宣布推出下一代Switchtec Gen 6 PCIe交换芯片。
    的头像 发表于 10-18 11:12 2021次阅读

    PCIe 6.0 SSD主控芯片狂飙!PCIe 7.0规范到来!

    通道的带宽达到256 GB / s,并且延迟相比上一代更低。PCIe 6.0 采用 PAM4(四电平脉冲幅度调制)编码技术,将每个符号编码为四个不同的电平,在同
    的头像 发表于 09-07 05:41 8572次阅读
    <b class='flag-5'>PCIe</b> <b class='flag-5'>6.0</b> SSD主控芯片狂飙!<b class='flag-5'>PCIe</b> 7.0规范到来!

    适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM skyworksinc

    电子发烧友网为你提供()适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM相关产品参数、数据手册,更有适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM的引脚图、接线图、封装
    发表于 09-05 18:34
    适用于<b class='flag-5'>下一代</b> GGE 和 HSPA 手机的多模/多频段 PAM skyworksinc

    曙光存储超级隧道技术助力应对PCIe 6.0

    8月29日,聚焦“智存·智算·智能”的第二届CCF中国存储大会在武汉隆重召开。会上,曙光存储副总裁郭照斌宣布,“超级隧道”技术能更好的应对PCIe 6.0,为
    的头像 发表于 09-03 14:01 675次阅读

    最新PCIe5.0 U.2硬盘抽取盒— ICY DOCK MB491V5K-B 开箱测评

    随着PCIe5.0存储方案逐渐普及,如何在高性能数据存储的同时实现“安全性”、“可维护性”与“工业级稳定性”,成为众多边缘计算、AI平台、车载与军工系统构建时的关注重点。今天要分享的这款产品
    的头像 发表于 08-01 14:48 1511次阅读
    最新<b class='flag-5'>PCIe5.0</b> U.2硬盘抽取盒— ICY DOCK MB491V5K-B 开箱测评

    下一代高速芯片晶体管解制造问题解决了!

    的过渡步骤。 不过2017 年提出的叉片设计初始版本似乎过于复杂,无法以可接受的成本和良率进行制造。现在,Imec 推出了其叉片晶体管设计的改进版本,该设计有望更易于制造,同时仍能为下一代工艺技术提供功率
    发表于 06-20 10:40