0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PCIe 7.0技术细节曝光

FPGA技术江湖 来源:EETOP 2025-09-08 10:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:EETOP

6 月 11 日 PCI SIG官宣 PCI Express 7.0(PCIe 7.0)规范最终版已制定完毕,但几乎没有公开任何技术细节。不过,在 7 月 16 日,PCI-SIG 通过 BrightTalk 公开了一些更详细的技术信息,下面就为大家介绍这些内容。

PCI Express 7.0 的设计目标

wKgZPGi-QweACzqsAAPNMCkQ4ow596.png

首先是PCI Express 7.0 的设计目标(图 1)。

图1:关注延迟(Latency)和带宽效率低下(Bandwidth Inefficiency)

从根本上来说,PCI Express 7.0 的带宽是 PCI Express 6.0 的两倍,并且具有向后兼容性,这一点没什么问题。但需要注意的是,与 PCI Express 5.0(即采用 NRZ 编码)相比,其带宽效率下降了不到 2%,同时延迟也有所增加(虽不到 10ns)。

不过,这其中约一半原因是由于实现了FLIT(帧单元),因此这并非 PCI Express 7.0 独有的问题,PCI Express 6.0 也存在类似情况(延迟方面还有其他因素,后文会提及)。

PCI Express 6.0 引入了 PAM4 编码,导致信号眼高(Eye Height)降至 NRZ 的约 1/3(图 2),PCI Express 7.0 也是如此。

b04b1c80-8c4d-11f0-8c8f-92fbcf53809c.jpg

图2:后续会展示 PCI Express 7.0 的眼图,其情况看起来相当严峻,让人不禁担心是否可行

如图1 所示,使用 PAM4 会导致眼高大幅降低,从而恶化误码率(BER)。为解决这一问题,若采用以太网中使用的强前向纠错(FEC)技术,会极大增加延迟(可达 100ns)。因此,PCI Express 7.0 仍沿用了 FLIT 技术,在将延迟开销降至最低的同时,将误码率控制在 1FIT 以下(图 3),这一点与 PCI Express 6.0 一致。

b0b13650-8c4d-11f0-8c8f-92fbcf53809c.jpg

图3:与 PCI Express 6.0 的指标对比后,差异便一目了然

PCI Express 7.0 新增了指标

值得注意的是,PCI Express 6.0 的指标仅包括重试概率(Retry Probability)和 FIT,而 PCI Express 7.0 新增了延迟(Latency)和带宽开销(Bandwidth Overhead),可见其设计已接近极限。

讲解中还提到了FLIT 模式的实现,但这与之前介绍的 PCI Express 6.0 的 FLIT 模式完全相同,这里便不再赘述。

不过,PCI Express 7.0 的重试概率本身翻了一倍(图 4)。

b10d0ab6-8c4d-11f0-8c8f-92fbcf53809c.jpg

图4:这是理所当然的,因为单位时间内的数据量翻倍,即使单位数据量的错误率相同,表面上错误发生的频率也会翻倍

即便如此,PCI Express 7.0 的 FIT 为 4.6×10⁻¹⁰,足以满足低于 1FIT 的要求。

作为PCI Express 6.1 特性新增的 UIO

接下来谈谈无序I/O(Unordered IO,简称 UIO)。这是去年 10 月作为 PCI Express 6.1 的特性新增的功能。PCI Express 原本采用的是加载 - 存储访问(Load-Store Access)模式,或者说生产者 - 消费者(Producer-Consumer)模式。简单来说,当某个设备生成数据后,通过通知其他设备,使后者能够使用该数据。这里所说的设备不仅包括 PCI Express 设备,还包括根联合体(Root Complex)后端的 CPU。为保障这一机制,PCI Express 实现了 Posted(非应答)、Non-Posted(应答)、Completion(完成)等流控制(Flow Control)类别(图 05)。

b1675af2-8c4d-11f0-8c8f-92fbcf53809c.jpg

图5:这似乎与 PCI Express 原本作为 I/O 设备(因此应处于主机侧管理之下)的设计理念有关

通过信用(Credit,用于流控制的管理数据)来保障生产者 - 消费者的顺序(图 6)。

b1c38bd8-8c4d-11f0-8c8f-92fbcf53809c.jpg

图6:实际上,这种排序规则以层级结构为前提,因此也带来了一些问题,但这部分属于未来的工作,本次暂不讨论非层级结构

然而,这也导致了一个问题:即使多个传输同时进行,也必须按照顺序依次处理事务(图7、8)。

b2218f30-8c4d-11f0-8c8f-92fbcf53809c.jpg

图7:在 PCI Express 设备向 CPU 传输时,CPU 向内存写入数据后,必须 “随后” 写入 Write flag f。但实际上,由于缓存的存在,顺序可能会颠倒,而这属于违规行为

b2826fbc-8c4d-11f0-8c8f-92fbcf53809c.png

图8:同样,在 PCI Express 设备向 CPU 传输时,CPU 向内存的写入可能会乱序执行,因此事务未必会按顺序处理。但如果按照内存写入顺序发送完成事务,可能会与 PCI Express 的原始顺序不一致,因此完成事务必须符合 PCI Express 的顺序

如图8 所示,PCI Express 虽实现了放宽排序(Relaxed Ordering,简称 RO)功能,可在一定程度上缓解上述限制,但仅靠 RO 无法解决的情况正逐渐增多。

为此,新引入了无序I/O(UIO)机制(图 09)。

b2e2297a-8c4d-11f0-8c8f-92fbcf53809c.jpg

图9:与 PCI 的延迟事务类似,简单来说,就是可以乱序发送多个事务

简言之,这是一种去除上述限制、允许事务乱序完成的机制。利用这一机制,例如在双插槽(2 Socket)系统中,可提高传输效率(图 10)。

b341a51c-8c4d-11f0-8c8f-92fbcf53809c.jpg

图10:在这个例子中,CPU 0 后端的 PCIe 设备 A 向 CPU 1 传输数据。不支持 UIO 时需要执行 10 个处理步骤,而使用 UIO 只需 4 个

据PCI-SIG 介绍,UIO 的优势包括:即使在大规模系统中也易于扩展(图 11)等(图 12)。

b39e14be-8c4d-11f0-8c8f-92fbcf53809c.jpg

图11:从下图可以看出,即便是 CPU×2 + 多个 PCIe 设备 + PCIe 交换机这样的场景,访问开销也会大幅降低,可在与上图中简单场景(CPU×2 + PCIe 设备)相近的开销下使用

b4024aba-8c4d-11f0-8c8f-92fbcf53809c.jpg

图12:如前所述,非树形拓扑预计未来将支持

需要说明的是,UIO 仅能在 FLIT 模式下使用,不支持非 FLIT 模式。目前,UIO 仍属于可选功能,还存在一些问题,例如空闲时延迟增加、编程环境尚未完善、支持 UIO 的原子指令尚未定义等。因此,未来或许会逐渐向 UIO 过渡,但初期的 PCI Express 7.0 控制器 / 设备是否支持 UIO,还存在不确定性。

PCI Express 7.0 的物理层

接下来谈谈物理层。如前次报道所述,配合PCI Express 7.0,已发布了 Optical Aware Retimer(光感知重定时器)的 ECN(工程变更通知),而 ReDriver(重驱动器)的规范正在制定中,预计 2025 年末发布 ECN(图 13)。

b45e4568-8c4d-11f0-8c8f-92fbcf53809c.jpg

图13:从这张图来看,Optical Aware Retimer 或许是指可集成到光互联(OCI)中的重定时器

此外,关于CopperLink(铜缆连接),预计 2026 年末发布线缆规范(图 14)。

b4b9adae-8c4d-11f0-8c8f-92fbcf53809c.png

图14:这里的 “PCIe 7.0 CopperLink cable solution demonstrated”,想必是在 2025 年 PCI-SIG 开发者大会(DevCon 2025)的展示环节中演示的

下面总结一下电气层的情况(图15)。

b51c305a-8c4d-11f0-8c8f-92fbcf53809c.jpg

图15:误码率(BER)需控制在 1×10⁻⁶以下,因为结合 FLIT 可实现低于 1FIT 的目标

PCB 损耗在 32GHz 时需控制在 1dB / 英寸以下,这一要求相当严格。而接收端采用 FFE(前馈均衡器)+DFE(判决反馈均衡器)的结构,也在预料之中。由于信号频率翻倍,所有损耗都会增加,这是不可避免的。但为了平衡损耗而控制 PCB 损耗,或许需要采用玻璃基板(图 16)。

b57d1fe6-8c4d-11f0-8c8f-92fbcf53809c.jpg

图16:通道长度其实与 PCI Express 6.0 相同。若不做任何改进、使用相同材料构建通道,损耗会增加,因此转向在 PCB 侧控制损耗的方针

此外,各种组件的要求也更加严苛。参考时钟的抖动需控制在0.067ps(图 17),而数据眼图若不使用二阶前导(2nd Pre-cursor),情况会相当严峻(图 18)。

b5de8448-8c4d-11f0-8c8f-92fbcf53809c.jpg

图17:不过,例如瑞萨电子(Renesas Electronics)已推出抖动低至 55fs 的锁相环(PLL)产品,因此虽严苛但并非不可能实现

b63c9f10-8c4d-11f0-8c8f-92fbcf53809c.jpg

图18:与图 2 对比,便能看出 PCI Express 7.0 的严苛程度

发送端参数如图19 所示,接收端参数如图 20 所示。

b69ff4ac-8c4d-11f0-8c8f-92fbcf53809c.jpg

图19:从这些数值可以看出,整体要求相当严苛。发射端均衡(Tx Equalization)仍保持 4 抽头,可能是因为转向由接收端解决问题

b7041892-8c4d-11f0-8c8f-92fbcf53809c.jpg

图20:眼高从 6mV 提升至 10mV,这想必是以使用发射端二阶前导(TX 2nd Pre-cursor)为前提。若不使用发射端二阶前导,能否达到 10mV,让人有些怀疑

合规眼宽(Compliance Eye Width)仅为 1.5625ps,这一数值十分惊人。而 PCI Express 6.0 仅需 16 抽头 DFE,PCI Express 7.0 则强化为 29 抽头 FFE+1 抽头 DFE,其升级幅度相当大。前文提到延迟最多增加约 10ns,这大半或许是由强化后的 FFE+DFE 导致的。

以上就是目前公开的PCI Express 7.0 相关信息。不得不说,其已接近电信号的极限。但正如之前的文章所述,PCI Express 7.0 预计 2028-2029 年左右投入市场。到那时,组件质量能否提升到足以轻松实现这一标准的水平,还是仍会处于勉强达标的状态,笔者目前也难以判断。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 带宽
    +关注

    关注

    3

    文章

    1029

    浏览量

    43025
  • PCIe
    +关注

    关注

    16

    文章

    1420

    浏览量

    87539
  • 眼图
    +关注

    关注

    1

    文章

    75

    浏览量

    21683

原文标题:太疯狂了!PCIe 7.0 技术细节曝光:眼图已到极限!

文章出处:【微信号:HXSLH1010101010,微信公众号:FPGA技术江湖】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PCIe 7.0发布:16通道双向512GB/s,拥抱光纤未来

    电子发烧友网报道(文 / 吴子鹏)日前,PCI-SIG 宣布正式推出 PCIe 7.0 规范。PCIe 7.0 继续沿用自 PCIe 6.0
    的头像 发表于 06-13 00:07 7010次阅读
    <b class='flag-5'>PCIe</b> <b class='flag-5'>7.0</b>发布:16通道双向512GB/s,拥抱光纤未来

    钛金PCIe Gen4控制器的核心特性与技术细节

    在数字经济飞速发展的今天,数据传输速率已成为硬件性能突破的核心瓶颈。作为国内首款适配中端FPGA的PCIe Gen4高速接口方案,钛金高速接口的闪亮登场,凭借高速低功耗特性、灵活配置能力与全面协议
    的头像 发表于 12-02 09:28 1768次阅读
    钛金<b class='flag-5'>PCIe</b> Gen4控制器的核心特性与<b class='flag-5'>技术细节</b>

    Air8000-LuatOS exvib扩展库实操指南:全流程技术细节深度解读

    掌握exvib扩展库的使用,是提升Air8000-LuatOS项目开发效率的关键。本文以全流程实操为核心,深度解读技术细节,涵盖初始化、数据采集、异常处理等环节,为开发者提供权威参考。 一
    的头像 发表于 11-01 20:09 107次阅读
    Air8000-LuatOS exvib扩展库实操指南:全流程<b class='flag-5'>技术细节</b>深度解读

    有哪些具体的技术细节需要企业在选择电能质量在线监测装置数据存储方式时注意?

      企业选择电能质量在线监测装置数据存储方式时,需重点关注 **“数据不丢、能用、安全、可扩展”** 四大核心目标,对应的技术细节多隐藏在 “数据格式适配、同步机制、安全加密、硬件可靠性、运维兼容性
    的头像 发表于 10-30 09:56 102次阅读

    瑞萨电子RUHMI工具集的技术细节

    苏勇(Andrew SU)是瑞萨电子中国市场部的在AI产品方向上的高级技术专家,负责瑞萨电子的AI相关产品和技术方案面向中国市场的产品定义和运营。
    的头像 发表于 09-23 10:25 1532次阅读
    瑞萨电子RUHMI工具集的<b class='flag-5'>技术细节</b>

    PCIe 6.0 SSD主控芯片狂飙!PCIe 7.0规范到来!

    通道的带宽达到256 GB / s,并且延迟相比上一代更低。PCIe 6.0 采用 PAM4(四电平脉冲幅度调制)编码技术,将每个符号编码为四个不同的电平,在同一信号周期内可携带更多比特的数据,无需增加
    的头像 发表于 09-07 05:41 7722次阅读
    <b class='flag-5'>PCIe</b> 6.0 SSD主控芯片狂飙!<b class='flag-5'>PCIe</b> <b class='flag-5'>7.0</b>规范到来!

    PCIe 7.0 Samtec已为您准备好N种互连解决方案

    年光通信大会(OFC)现场演示内容,简要介绍了 六种Samtec连接器系统,均能运行于PCIe 7.0数据速率 。 演示细节 演示包含 板对板连接器组件
    的头像 发表于 09-04 11:38 1416次阅读
    <b class='flag-5'>PCIe</b> <b class='flag-5'>7.0</b>   Samtec已为您准备好N种互连解决方案

    揭秘徐工新能源重卡的技术细节

    对于一台新能源重卡而言,无论在安全方面多做多少努力都不为过。徐工汽车将新能源重卡的“安全”筑入整车的结构设计中,融进控制系统每一个响应逻辑里,更深藏技术细节的每一行代码之后。
    的头像 发表于 08-11 11:45 990次阅读

    PCIe 8.0 规范公布:1TB/s 带宽、256GT/s 速率

    将使速率在 PCIe 7.0 的基础上翻倍至 256.0 GT/s,通过 x16 配置实现 1TB/s 的双向带宽。   从 PCI-SIG 目前公布的细节来看,PCIe 8.0 首
    的头像 发表于 08-08 09:14 7048次阅读

    SMA连接器名称由来:SubMiniature Version A 的技术细节

    SMA连接器名称中的“SubMiniature Version A”,精准概括了其小型化、开创性的设计理念,而德索精密工业以卓越的技术细节和严谨的制造工艺,为SMA连接器的高性能连接提供了有力支撑,让这一经典连接器在射频与微波连接领域持续焕发新的光彩。
    的头像 发表于 06-24 11:30 488次阅读
    SMA连接器名称由来:SubMiniature Version A 的<b class='flag-5'>技术细节</b>

    PCIe 7.0最终版草案发布,传输速率128 GT/s,PCIe 6.0加速商业化

    ,这是PCIe 7.0规范正式版本发布前的最后一个草案版本,而正式版将于2025年晚些时候发布。   其核心技术参数目标包括:传输速率128 GT/s,x16 配置下双向带宽达 512 GB/s;采用
    发表于 03-29 00:07 1044次阅读

    索尼IP编码板:技术细节与应用探索

    索尼IP编码板的技术细节,并探讨其在不同领域的应用价值。 技术细节:卓越性能与高效传输 索尼IP编码板作为连接硬件与软件的桥梁,集成了精密的电路设计与先进的芯片技术。它不仅能够接收并处理来自传感器、摄像头等外部设备
    的头像 发表于 03-20 10:10 881次阅读

    PCIe 7.0 互连— PCIe的尽头会是光吗?

    伴随大语言模型和相关训练系统迅猛增长、对非结构化数据处理的需求急剧上升,市场对算力的需求也是呈指数级增加。PCIe作为计算机和服务器中使用广泛的高速数据传输技术发展迅猛,今年4月份PCI-SIG已经
    的头像 发表于 02-10 10:03 726次阅读
    <b class='flag-5'>PCIe</b> <b class='flag-5'>7.0</b> 互连— <b class='flag-5'>PCIe</b>的尽头会是光吗?

    SONY编码板测试:技术细节与性能评估

    和信号转换,其性能优劣直接影响到整个产品的运行效率和稳定性。本文将深入探讨SONY编码板的测试过程,从技术细节到性能评估,全面解析这一关键组件的重要性。 一、SONY编码板概述 SONY编码板,作为连接硬件与软件的桥梁,集成了复
    的头像 发表于 01-15 16:37 693次阅读