0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CXL是什么?为什么它是各种应用程序的游戏规则改变者?

半导体产业纵横 来源:半导体产业纵横 2023-06-25 10:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

高带宽互连彻底改变了以数据为中心的计算。

CXL(Compute Express Link)可以提高数据中心内存的性能、可扩展性和灵活性。MemVerge 的 Steve Scargall 解释了 CXL 是什么、它是如何工作的,以及为什么它是各种应用程序的游戏规则改变者,例如 AI/ML、HPC、数据库和分析。他还强调了采用 CXL 标准化的云计算和数据中心基础设施的一些行业趋势。

CXL是一种新兴的开放式行业标准互连,彻底改变了以数据为中心的计算。凭借其在 CPU 和设备(例如加速器、内存扩展和持久内存设备)之间的高带宽和低延迟缓存一致性连接,CXL 有可能重塑数据中心内存的性能、可扩展性和灵活性。通过解决 AI/ML 应用程序面临的常见内存挑战并启用新的高性能内存架构,CXL 有望成为以数据为中心的计算的下一代互连。

什么是 CXL?

CXL 是一种行业采用的开放标准,为处理器、内存扩展和加速器提供高速缓存一致性互连。它基于 PCI Express (PCIe) 规范物理和电气接口,但为 AI/ML 应用程序提供了额外的功能和优势。CXL 可实现 CPU 内存空间与附加设备(例如加速器、GPU 或内存设备)上的内存之间的内存一致性。这意味着 CPU 和设备可以共享相同的内存视图并访问它,而无需任何软件干预或同步。CXL 还通过允许 CPU 以低延迟和高带宽访问连接设备上更大的内存池来扩展内存。这可以增加 AI/ML 应用程序的内存容量和性能。

规范的三个主要版本描述了 CXL 标准。未来计划更多主要版本。现有主要版本的更新也将根据需要公布。每个主要版本都为以前的版本添加了新功能。

CXL 1.0:CXL 的第一个版本,于 2019 年 3 月发布,基于 PCIe 5.0。它允许主机 CPU 使用缓存一致性协议 (CXL.cache) 访问加速器设备上的共享内存,并使用内存语义 (CXL.mem) 启用内存扩展。

CXL 2.0:CXL 的第二个版本,于 2020 年 11 月发布,基于 PCIe 5.0。它支持 CXL 交换,将多个 CXL 设备连接到一个主机处理器或将每个设备连接到多个主机处理器。它还实现了设备完整性和数据加密功能。

CXL 3.0:CXL 的第三个版本,于 2022 年 8 月发布,基于 PCIe 6.0。它支持比 CXL 2.0 更高的带宽和更低的延迟,并增加了设备热插拔、电源管理和错误处理等新功能。

图 1 显示了每个主要 CXL 版本的功能比较。

37732ed2-11a8-11ee-962d-dac502259ad0.png图 1:CXL 功能比较

CXL 规范描述了三种允许设备相互通信的协议。

CXL.io:PCIe 5.0 协议的增强版本,可用于初始化、链接、设备发现、枚举和寄存器访问。它为 I/O 设备提供非一致性加载/存储接口。

CXL.cache :一种缓存一致性协议,它定义了主机和设备之间的交互,允许连接的 CXL 设备使用请求和响应方法以极低的延迟有效地缓存主机内存。

CXL.mem :一种内存协议,它使用加载和存储命令为主机处理器提供对连接设备内存的访问,其中主机 CPU 充当主设备,CXL 设备充当从属设备。它可以支持易失性和持久性内存架构。

至少,所有 CXL 设备都必须使用 CXL.io,但可以选择支持 CXL.cache 或 CXL.mem,或同时支持两者。 这些组合派生出三种设备类型:

类型 1 :没有本地内存的专用加速器(例如智能 NIC)。设备依赖于使用 CXL.io 和 CXL.cache 协议对主机 CPU 内存进行一致访问。它们可以扩展 PCIe 协议功能(例如原子操作),并且可能需要实现自定义排序模型。

类型 2 :具有高性能本地内存(GDDR 或 HBM)的通用加速器(GPU、ASICFPGA)。要访问主机 CPU 和设备内存,设备可以使用 CXL.io、CXL.cache 和 CXL.mem 协议。它们可以支持连贯和非连贯事务。

类型 3 :没有本地缓存的内存扩展板和持久内存设备。设备可以使用 CXL.io 和 CXL.mem 协议通过加载和存储命令为主机 CPU 提供对内存的访问。它们可以支持易失性和持久性内存架构。

基础设施用例

CXL 是云和本地数据中心基础设施的游戏规则改变者,预计将很快得到广泛采用和标准化,包括:

1.云计算

CXL 可以使云服务提供商通过利用支持 CXL 的设备(例如加速器、内存扩展设备和持久性内存设备)为其客户提供更快、更高效的服务。云服务提供商每年在未使用或未充分利用的主内存(称为“搁浅内存”)上花费数十亿美元。应用程序可以更优化地使用集群中的计算节点按需访问的 CXL 设备池,从而优化数据中心资源。

2.数据中心存储

与云环境类似,虽然规模小得多,但 CXL 设备可以使数据中心运营商构建可持续发展的环境,并通过使用支持 CXL 的设备显著降低其基础设施成本和使用率。CXL 可以通过启用对内存驻留数据的低延迟和高带宽访问来提高块存储性能和可靠性。

3. 边缘计算

CXL 可以使边缘计算平台通过使用支持 CXL 的设备(例如加速器、智能 NIC、内存扩展设备和持久内存设备)来处理不断增加的数据量和复杂性。在将数据发送到主数据中心之前在边缘处理数据可以减少流量并提高边缘计算性能、效率和安全性。

4. 网络

CXL 可以使网络平台通过使用支持 CXL 的网络设备(例如智能 NIC、FPGA 和 ASIC)来处理不断增加的网络流量和复杂性。CXL 可以通过实现对设备内存的一致和非一致访问以及支持原子操作和自定义排序模型来提高网络性能、可扩展性和功能。

应用用例

应用程序将从支持 CXL 的基础架构中受益匪浅。一些主要的兴趣领域包括:

1.AI/ML加速

CXL 可以为 GPU、ASIC 或 FPGA 等 AI/ML 加速器实现更快、更高效的 CPU 到设备和 CPU 到内存的连接。CXL 可以支持异构设备之间的一致性和非一致性事务、内存扩展和资源共享。允许应用程序处理更大的数据集,同时减少主机之间传输的数据量,从而缩短获得结果的时间。

2.大规模内存、分析和图形数据库

CXL 允许数据库访问无限的低延迟和高带宽内存,从而使系统能够在更大的数据池上工作。

3.高性能计算

CXL 可以通过利用支持 CXL 的加速器和内存池来提高高性能计算的性能、可扩展性和灵活性。CXL 3.0 引入了共享内存功能,允许许多计算节点就地访问内存驻留数据,而无需在运行前将其复制到本地,然后再将结果复制回来。

使用 CXL 的行业标准互连加速以数据为中心的计算

CXL 是一种新兴的开放式行业标准互连,可在 CPU 和设备(如加速器、内存扩展和持久内存设备)之间提供高带宽和低延迟缓存一致性连接。CXL 可以提高数据中心资源的性能、可扩展性和灵活性。CXL 可以帮助解决 AI/ML 应用程序面临的一些常见内存挑战,例如内存不足错误、溢出到磁盘以及数据/计算偏差。

CXL 还可以支持需要大规模和高性能内存架构的新应用程序和用例,例如内存数据库、实时分析和高性能计算。由英特尔AMDArm、Astera Labs、三星、美光、X-Conn 等众多行业领导者和创新者组成的不断壮大的生态系统支持 CXL。作为以数据为中心的计算的下一代互连,CXL 有望在不久的将来得到广泛接受和标准化。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    247121
  • 电源管理
    +关注

    关注

    117

    文章

    6548

    浏览量

    147534
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39712
  • PCIe接口
    +关注

    关注

    0

    文章

    121

    浏览量

    10461

原文标题:CXL是什么?它是如何工作的?

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Prometheus超低亮高精度色度计- HDR显示计量领域的游戏规则改变!

    什么是HDR?高动态范围(High-DynamicRange,简称HDR)作为超高清音视频产业的关键技术之一,拥有更广的色彩容积和更高的动态范围,为图像保留更多细节。通过丰富的图像亮部和暗部细节,在对比度、灰度等维度上提升影像质量,让用户眼中的影像更加细腻真实,更富有感染力。在HDR技术中,动态范围指的就是图像的最大亮度和最小亮度的比值。对比度有几种不同的计
    的头像 发表于 06-04 11:12 1160次阅读
    Prometheus超低亮高精度色度计- HDR显示计量领域的<b class='flag-5'>游戏规则</b><b class='flag-5'>改变</b><b class='flag-5'>者</b>!

    第二代AMD Versal Premium系列SoC满足各种CXL应用需求

    第二代 AMD Versal Premium 系列自适应 SoC 是一款多功能且可配置的平台,提供全面的 CXL 3.1 子系统。该系列自适应 SoC 旨在满足从简单到复杂的各种 CXL 应用需求
    的头像 发表于 04-24 14:52 966次阅读
    第二代AMD Versal Premium系列SoC满足<b class='flag-5'>各种</b><b class='flag-5'>CXL</b>应用需求

    InspireSemi借助Cadence解决方案为下一代AI铺路

    InspireSemi 致力于为 HPC、AI、图形分析和其他计算密集型应用开发和提供卓越的加速计算解决方案。InspireSemi 致力于打造开放、多功能的架构,具有极快的速度、节能、开发人员友好的全 CPU 编程模型和改变游戏规则的经济实惠性,因此在与创新
    的头像 发表于 03-27 14:37 646次阅读

    MCP:连接AI与应用程序的开放标准!

    。 在第二种方式中,开发需要为AI大模型编写与具体应用程序协作的访问代码,例如,开发希望DeepSeek-R1与Gmail协作,就需要手动编写协作代码。这种手动编写协作代码的方式,耗时费力,还难以复用。 一,什么是MCP?
    的头像 发表于 03-21 18:21 1881次阅读
    MCP:连接AI与<b class='flag-5'>应用程序</b>的开放标准!

    SK海力士引领下一代HBM技术发展

    在人工智能市场中,HBM仍是“游戏规则改变(Game Changer)”。随着技术竞争愈发激烈,客户需求也更加多样化。
    的头像 发表于 03-12 16:07 953次阅读

    一夜爆火的DeepSeek一体机,如何改写AI游戏规则

    一夜爆火的DeepSeek一体机,如何改写AI游戏规则? 过去一个多月,科技圈有个“新晋顶流”C位出道,名字叫DeepSeek一体机。 它火到什么程度? 朋友圈不断刷屏,有人调侃:“没抢到
    的头像 发表于 03-11 15:52 1006次阅读
    一夜爆火的DeepSeek一体机,如何改写AI<b class='flag-5'>游戏规则</b>?

    使用Ozone调试基于nRF9160 Zephyr应用程序

    Ozone是SEGGER免费的嵌入式软件调试器。它是一个强大的工具,可以让你深入了解嵌入式系统中发生的事情。它在调试nRF9160 Zephyr应用程序时特别有用。整理多个线程和多映像构建可能很困难,但这就是你想要的工具。
    的头像 发表于 02-25 17:07 1425次阅读
    使用Ozone调试基于nRF9160 Zephyr<b class='flag-5'>应用程序</b>

    SMART Modular CXL AIC内存扩充卡获CXL联盟认证

    近日,全球领先的整合型内存与储存解决方案提供商SMART Modular世迈科技(隶属于Penguin Solutions™集团)宣布,其4-DIMM和8-DIMM CXL®(Compute
    的头像 发表于 02-14 10:15 706次阅读

    SMART Modular世迈科技CXL内存扩充卡获CXL联盟认证

    SMART Modular世迈科技近日宣布其4-DIMM和8-DIMM CXL®(Compute Express Link®)内存扩充卡已成功通过CXL 2.0认证测试,并正式被列入CXL联盟的整合
    的头像 发表于 02-05 15:59 713次阅读

    SK海力士在CXL技术领域的研发进展

    挑战传统,打破限制,勇攀高峰,打破常规们在寻求开创性解决方案的过程中重塑规则。继SK海力士品牌短片《谁是打破常规》播出后,将推出一系列文章,展示公司在重塑技术、重新定义行业标准方面采取的
    的头像 发表于 01-24 10:25 1136次阅读
    SK海力士在<b class='flag-5'>CXL</b>技术领域的研发进展

    AWTK-WEB 快速入门(4) - JS Http 应用程序

    导读XMLHttpRequest改变了Web应用程序与服务器交换数据的方式,fetch是其继任。本文介绍一下如何使用JS语言开发AWTK-WEB应用程序,并用fetch访问远程数据。
    的头像 发表于 01-22 11:31 731次阅读
    AWTK-WEB 快速入门(4) - JS Http <b class='flag-5'>应用程序</b>

    澜起科技CXL®内存扩展控制器芯片通过CXL 2.0合规性测试

    近日,澜起科技在CXL(Compute Express Link)技术领域取得了又一重要里程碑。其自主研发的CXL®内存扩展控制器(MXC)芯片成功通过了CXL 2.0合规性测试,并被列入CX
    的头像 发表于 01-21 14:44 1474次阅读

    澜起科技MXC芯片列入首批CXL 2.0合规供应商清单

    近日,澜起科技研发的CXL内存扩展控制器(MXC)芯片成功通过了CXL 2.0合规性测试,列入CXL联盟公布的首批CXL 2.0合规供应商清单。这是继2023年率先列入
    的头像 发表于 01-21 10:32 965次阅读
    澜起科技MXC芯片列入首批<b class='flag-5'>CXL</b> 2.0合规供应商清单

    ANACONDA——关于发布数据应用程序的新简单方法

    与 Anaconda 的云笔记本服务无缝集成,为用户提供了一种轻松共享笔记本结果的方式,并让其他人也可以随意的访问它们。 下面我们来了解关于这项新功能的实际应用: 这项功能与 Panel 的多功能性相结合,将彻底改变您发布数据应用程序的方式。使用这个强大的工具,为共享和协
    的头像 发表于 01-17 11:39 644次阅读
    ANACONDA——关于发布数据<b class='flag-5'>应用程序</b>的新简单方法

    TAS2521应用程序参考指南

    电子发烧友网站提供《TAS2521应用程序参考指南.pdf》资料免费下载
    发表于 12-10 13:49 0次下载
    TAS2521<b class='flag-5'>应用程序</b>参考指南