0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一文读懂CXL协议

e9Zb_gh_8734352 来源:FPGA技术联盟 2023-02-11 11:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2001年,英特尔公布了第三代I/O技术——3GIO技术(后更名为PCI Express,即PCIe),以高性能、高扩展性、高可靠性及出色的兼容性取代了包括AGP和PCI在内所有的内部总线并且不断升格。例如,2019年5月底公布的PCIe 5.0,其以32Gb/s的单通道带宽与32GT/s(Giga Transmission per second)每通道数据传输速率,满足了现今绝大多数的需求。但应对数据TB级增长、异构计算大行其道的当下,PCIe在内存使用效率、延迟和数据吞吐量等方面,已经面临压力。 二十年后,在如今这个数据爆炸式增长,异构计算大行其道的当下,曾经的“未来之星“PCI-e 已经开始出现后继无人的现象,无法成为 CPUGPUFPGA 以及其他 AI 计算设备之间沟通的桥梁。为了达到最佳的计算效果,我们越来越期待一种以内存为中心的、富有变革性的新技术出现,基于PCI-e协议的CXL技术便在此环境下出世。 2019年,英特尔推出的CXL技术似乎杀出了重围。短短几年时间,CXL便成为业界公认的先进设备互联标准,其最为强劲的竞争对手Gen-Z、OpenCAPI都纷纷退出了竞争,并将Gen-Z协议、OpenCAPI协议转让给CXL。

1、什么是CXL?

CXL全称为Compute Express Link,作为一种全新的开放式互联技术标准,其能够让CPU与GPU、FPGA或其他加速器之间实现高速高效的互联,从而满足高性能异构计算的要求,并且其维护CPU内存空间和连接设备内存之间的一致性。总体而言,其优势高度概括在极高兼容性和内存一致性两方面上。

2、CXL 协议

CXL 标准定义了 3 个协议,这些协议在通过标准 PCIe 5.0 PHY 以 32 GT/s 传输之前一起动态复用: CXL.io 协议本质上是经过一定改进的 PCIe 5.0 协议,用于初始化、链接、设备发现和列举以及寄存器访问。它为 I/O 设备提供了非一致的加载/存储接口。 CXL.cache 协议定义了主机和设备之间的交互,允许连接的 CXL 设备使用请求和响应方法以极低的延迟高效地缓存主机内存。 CXL.mem 协议提供了主机处理器,可以使用加载和存储命令访问设备连接的内存,此时主机 CPU 充当主设备,CXL 设备充当从属设备,并且可以支持易失性和持久性存储器架构。 如图 1 所示,CXL.cache 和 CXL.mem 合并且共享一个公共链路和事务层,而 CXL.io 有自己的链路和事务层。

db0d1a24-a927-11ed-bfe3-dac502259ad0.png

三个协议产生的数据都通过仲裁和多路复用 (ARB/MUX) 模块一起动态复用,然后被移交到 PCIe 5.0 PHY,进而以 32GT/s 的速度进行传输。ARB/MUX 在 CXL 链路层(CXL.io 和 CXL.cache/mem)发出的请求之间进行仲裁,并根据仲裁结果复用数据,仲裁结果使用加权循环仲裁,权重由主机设置。ARB/MUX 还处理链路层发出的功耗状态转换请求,向物理层创建实现有序降耗操作的单个请求。

CXL 通过固定宽度的 528 位微片传输数据,该微片由四个 16 字节时隙组成,并添加了两个字节 CRC:(4 x 16 + 2 = 66 字节= 528 位)。插槽采用多种格式定义,可专用于 CXL.cache 协议或 CXL.mem 协议。片头定义了插槽格式,并携带允许事务层将数据正确路由到预期协议的信息。

由于 CXL 使用 PCIe 5.0 PHY 和电气元件,它可以有效地插入到任何可以通过 Flex Bus 使用 PCIe 5.0 的系统中。Flex Bus 是一个灵活的高速端口,可以静态配置为支持 PCIe 或 CXL。图 2 举例显示了 Flex Bus 链路。这种方法使 CXL 系统能够利用 PCIe 重定时器;但是,目前 CXL 仅定义为直连 CPU 链路,因此无法利用 PCIe 交换机。随着标准的逐步完善,交换功能可能会被添加到标准中;如果是这样,则需要创建新的 CXL 交换机。

db20caec-a927-11ed-bfe3-dac502259ad0.png

3、CXL 设备类型

CXL.io 协议用于初始化和链接,所以必须获得所有 CXL 设备的支持,如果 CXL.io 协议发生故障,链接就无法运行。其他两个协议的不同组合产生了总共三种被定义并受 CXL 标准支持的独特 CXL 设备类型。

图 3 显示了三种已定义的 CXL 设备类型及其相应的协议、典型应用以及支持的存储器访问类型。

db63e53e-a927-11ed-bfe3-dac502259ad0.png

对于 2 型设备,CXL 定义了两个一致性“偏置”,用于控制 CXL 对主机和设备连接存储器之间的一致性数据的处理方式。偏置模式指主机偏置和设备偏置,并且操作模式可以根据需要发生改变,从而在链路操作期间优化给定任务的性能。

2 型设备(例如,加速器)处理提交给主机的工作时间及其后续完成之间的数据时,设备偏置模式用于确保设备可以直接访问其设备连接的存储器,而无需与主机的一致性引擎通信。因此,设备可保证主机没有缓存线路。这为设备提供了最优的延迟性能,使得设备偏置成为加速器执行工作的主要操作模式。主机处于设备偏置模式时,主机仍然可以访问设备连接的存储器,但性能却不是最优。

主机偏置模式优先考虑从主机到设备连接存储器的一致性访问。该模式通常在工作提交期间使用,此时数据会从主机写入设备连接的存储器,而且在主机将数据从设备连接的存储器中导出后,可使用该模式完成工作。在主机偏置模式下,设备连接的存储器对于设备而言就像主机连接的存储器一样,如果设备需要访问,就通过一条发送到主机的请求进行处理。

可以使用软件或硬件,通过软件辅助和硬件自治这两种受支持的模式管理机制来控制偏置模式。加速器或其他 2 型设备可以选择偏置模式,如果两种模式均未选择,则系统默认为主机偏置模式,这样就必须通过主机路由对设备连接存储器进行所有访问。偏置模式可以使用 4KB 页面的颗粒度进行更改,并通过 2 型设备中执行的偏置表进行跟踪。

CXL 标准的一个重要特征是一致性协议是不对称的。Home 缓存代理仅停留在主机中。因此,主机控制存储器的缓存,从而解决连接的 CXL 设备请求的给定地址的整个系统的一致性问题。这完全不同于正在使用的现有专有和公开的一致性协议,特别是那些用于 CPU 到 CPU 连接的协议,因为它们通常是对称的,会使得所有互连设备都变得对等。

虽然这样有一些优点,但是对称的高速缓存一致性协议更加复杂,并且所有设备都必须处理由此产生的复杂性。具有不同架构的设备可以采用不同的方法来实现在微架构级别优化的一致性,而这一情况可能会为实现广泛的行业采用增加难度。通过使用主机控制的非对称方法,可以将不同的 CPU 和加速器轻松纳入新兴 CXL 生态系统。

4、CXL的未来

可以设想在具有内存一致性的大型系统中同时使用多个协议来处理 CPU 到 CPU、CPU 到连接设备以及更长距离的机箱到机箱要求。目前,CXL 致力于为服务器提供经过优化的解决方案。CXL 固有的不对称性意味着它可能不适用于 CPU 到 CPU 或加速器到加速器的连接。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11382

    浏览量

    226570
  • 协议
    +关注

    关注

    2

    文章

    620

    浏览量

    41289
  • 互联技术
    +关注

    关注

    0

    文章

    13

    浏览量

    8519

原文标题:一文读懂CXL协议

文章出处:【微信号:gh_873435264fd4,微信公众号:FPGA技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    读懂微电网协调控制系统柜:定义、核心作用与应用边界

    高效、稳定、安全运行的关键设备。很多人对其认知模糊,或将其与传统配电柜混淆,本文将从定义、核心作用、应用边界三个维度,读懂微电网协调控制系统柜,厘清其核心价值与适用场景。
    的头像 发表于 05-29 11:06 415次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>读懂</b>微电网协调控制系统柜:定义、核心作用与应用边界

    什么是段码屏?宁波旭达电子读懂它的工作原理与结构

    旭达电子科技有限公司,我们每天都在与这些方寸之间的玻璃打交道。今天,就由旭达为您揭开段码屏的神秘面纱,带您读懂它的工作原理与内部结构。、什么是段码屏?它是如
    的头像 发表于 05-25 11:37 70次阅读
    什么是段码屏?宁波旭达电子<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>读懂</b>它的工作原理与结构

    读懂UPS电源分类

    UPS不间断电源的分类维度多样,行业内对不同分类方式常存在认知误区。现整理UPS分类标准,读懂,清晰明了。
    的头像 发表于 05-07 13:55 680次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>读懂</b>UPS电源分类

    读懂 MAX504/MAX515:低功耗 10 位串行 DAC 优选

    读懂 MAX504/MAX515:低功耗 10 位串行 DAC 优选 、引言 在电子设计的世界里,数模转换器(DAC)就像是数字信号与模拟世界之间的桥梁。今天我们就来深入了解
    的头像 发表于 04-16 15:20 339次阅读

    读懂爱芯元智2025年度报告

    读懂爱芯元智2025年度报告
    的头像 发表于 03-28 11:42 458次阅读
    <b class='flag-5'>一</b>图<b class='flag-5'>读懂</b>爱芯元智2025年度报告

    全自动划片机与半自动划片机怎么选?读懂选型关键

    全自动划片机与半自动划片机怎么选?读懂选型关键在半导体封装、LED制造、光伏电池加工等精密加工领域,划片机作为实现晶圆、芯片等材料高精度切割的核心设备,其选型直接决定生产效率、产品良率及综合
    的头像 发表于 03-16 20:54 651次阅读
    全自动划片机与半自动划片机怎么选?<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>读懂</b>选型关键

    读懂MAX20733集成式降压开关稳压器

    读懂MAX20733集成式降压开关稳压器 在当今电子设备对高性能、高效率电源的迫切需求下,款优秀的开关稳压器至关重要。今天我们就来深入剖析
    的头像 发表于 03-16 10:30 349次阅读

    读懂SDWAN:打破网络壁垒,赋能企业数字化转型——附云边云科技实践解析

    种更高效、灵活、经济的网络解决方案。而SDWAN(软件定义广域网)的出现,正是为了解决这些难题,成为企业数字化转型的“网络基石”。今天,我们就用通俗的语言,读懂S
    的头像 发表于 02-09 14:51 895次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>读懂</b>SDWAN:打破网络壁垒,赋能企业数字化转型——附云边云科技实践解析

    Penguin Solutions SMART Modular CXL NV-CMM E3.S 2T 内存模块通过 CXL 兼容性认证

    失性内存模块已成功通过 CXL® 兼容性测试。此项里程碑不仅代表产品符合行业标准,也进步确立 Penguin Solutions 在 CXL 先进内存技术领域中值得信赖的领导地位。该产品现已正式列入
    的头像 发表于 01-15 15:35 1237次阅读

    协议“老将”,连接工业智能的桥梁——读懂ModBus通信协议

    、什么是ModBus? ModBus是种串行通信协议,由Modicon公司(现施耐德电气)于1979年推出,最初用于可编程逻辑控制器(PLC)之间的通信。如今,它已成为工业自动化领域的通信
    发表于 12-15 10:08

    读懂:CWDM和DWDM的核心差异

    光纤通信里的“两兄弟”CWDM和DWDM,名字只差个字母,差别可大了去!今天讲透核心差异,小易帮你快速分清~
    的头像 发表于 09-17 18:19 1537次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>读懂</b>:CWDM和DWDM的核心差异

    读懂 PWM控制背光亮度原理

    关于PWM控制背光亮度原理的详细介绍 读懂PWM调光:为何你的屏幕亮度可随心而变? 你是否曾好奇,手机或电脑屏幕的亮度是如何从最暗无级调整到最亮的?这背后的魔法,主要归功于项名为
    发表于 09-03 08:48

    澜起科技推出CXL® 3.1内存扩展控制器,助力下代数据中心基础设施性能升级

    澜起科技今日宣布,推出基于CXL® 3.1 Type 3标准设计的内存扩展控制器(MXC)芯片M88MX6852,并已开始向主要客户送样测试。该芯片全面支持CXL.mem和CXL.io协议
    的头像 发表于 09-01 10:56 1084次阅读

    PCIe协议分析仪能测试哪些设备?

    ,分析高负载下设备的热性能。 应用价值:防止过热导致的性能下降或硬件损坏。 六、新兴技术设备 CXL设备(如CXL内存扩展器) 测试场景:分析CXL协议下的内存共享和缓存
    发表于 07-25 14:09

    读懂CAN XL协议

    随着汽车和工业应用中数据通信量的增加,传统的CAN协议已无法满足更高的数据速率需求。传统CAN协议在数据速率和总线负载能力方面存在限制,难以满足高带宽和高实时性的应用场景。为此,CAN XL(Controller Area Network eXtended Large)应
    的头像 发表于 07-03 14:53 4844次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>读懂</b>CAN XL<b class='flag-5'>协议</b>