电子发烧友网报道(文/周凯扬)随着AI与HPC运算的盛行,如今为了将算力继续扩展下去,CPU和GPU都在朝着多核的方向发展下去,计算密度也在大幅提升。此外,数据中心也越来越多地开始转向异构工作负载,对基础架构、性能和可用性提出了又一轮的要求,也在加速存储产品的转型,催生了CXL这样的新技术,但仅仅只靠CXL,是无法打破我们所说的内存瓶颈的。
加速内部流量成为服务器性能的新关键
100GbE模块的出现后,在网络交换与传输性能如此发达的当下,远程存储已经成了越来越多企业的首选。但本地存储也在经历一轮性能的革命,NVMe、NVDIMM等技术演进进一步降低了存储的网络延迟,解决了一路走高的内部带宽需求。
那么服务器内部数据的移动要如何跟上呢?在复杂的服务器基础架构中,内部数据的交换往往由多个内存缓冲拷贝组成,比如内核到I/O、I/O到特定硬件,实现方式主要靠不同层级的软件栈,但软件到软件间的数据交换仍靠的是CPU。
当下的内存数据移动的软件标准为memcpu,虽然已经足够稳定,但也限制了应用的性能。比如为了提供上下文隔离而招致更大的软件开销。所以大家开始尝试DMA,这种用于卸载软件复制循环的策略。虽说这样做解放了CPU的部分负担,但这种方案与特定设备的接口绑定,只适合专门的特权软件和I/O用例,更别提前向兼容了,尤其是在公有云这种多人功用的虚拟环境中。
SDXI,新的数据加速器接口标准
这就引出了一系列痛点,比如既要从CPU执行周期中将I/O解放出来,又要保证架构的稳定性。提供虚拟机加速的同时,又能帮助开发者从已有软件栈中迁移到新的方案上,还要考虑到当下新的内存互联方案,比如CXL、Gen-Z等等。为了解决这些痛点,2020年起,SNIA(全球网络存储工业协会)成立了一个新的工作组并提出了SDXI(智能数据加速器接口)这一概念,为的就是提供一个可扩展、虚拟化且前向兼容的内存数据移动与加速接口规范。

SDXI下的内存间数据移动 / SNIA
SDXI作为一个标准化方案,不仅要兼容DRAM、SCM、MMIO、CXL和Gen-Z这些不同的内存,也要为CPU、GPU、FPGA、智能I/O等提供标准的加速器接口。如此一来,SDXI可以在不同的地址空间实现数据移动,包括用户地址空间和不同的虚拟机等。而且一旦连接建立,数据移动再也不需要特权软件作为中介。从戴尔在PCIe 3.0 FPGA上的原型测试上来安,改用SDXI可以实现超过memcpy两倍以上的线性拷贝速度。
截至目前,不少内存厂商和服务器厂商都已经加入了对SDXI的贡献行列中来,比如AMD、Arm、戴尔、HPE、IBM,以及美光、三星、SK海力士等。他们也在考虑在1.0标准之后,继续从QoS、延迟、RAS上加以改进,在实现未来版本前向与后向兼容的同时,一起推动SDXI在CXL系统架构中的普及。
小结
在ARM、RISC-V纷纷入局数据中心,并推出百核、千核的CPU处理器后,更快的数据交换将成为一个必然的需求,未来的网络与存储技术也需要SDXI提供这样的扩展性。何况SDXI提供的不仅仅是加速,还是一个标准化接口,在满足数据移动性能的同时,支持软件爱你的重复利用和虚拟化。
加速内部流量成为服务器性能的新关键
100GbE模块的出现后,在网络交换与传输性能如此发达的当下,远程存储已经成了越来越多企业的首选。但本地存储也在经历一轮性能的革命,NVMe、NVDIMM等技术演进进一步降低了存储的网络延迟,解决了一路走高的内部带宽需求。
那么服务器内部数据的移动要如何跟上呢?在复杂的服务器基础架构中,内部数据的交换往往由多个内存缓冲拷贝组成,比如内核到I/O、I/O到特定硬件,实现方式主要靠不同层级的软件栈,但软件到软件间的数据交换仍靠的是CPU。
当下的内存数据移动的软件标准为memcpu,虽然已经足够稳定,但也限制了应用的性能。比如为了提供上下文隔离而招致更大的软件开销。所以大家开始尝试DMA,这种用于卸载软件复制循环的策略。虽说这样做解放了CPU的部分负担,但这种方案与特定设备的接口绑定,只适合专门的特权软件和I/O用例,更别提前向兼容了,尤其是在公有云这种多人功用的虚拟环境中。
SDXI,新的数据加速器接口标准
这就引出了一系列痛点,比如既要从CPU执行周期中将I/O解放出来,又要保证架构的稳定性。提供虚拟机加速的同时,又能帮助开发者从已有软件栈中迁移到新的方案上,还要考虑到当下新的内存互联方案,比如CXL、Gen-Z等等。为了解决这些痛点,2020年起,SNIA(全球网络存储工业协会)成立了一个新的工作组并提出了SDXI(智能数据加速器接口)这一概念,为的就是提供一个可扩展、虚拟化且前向兼容的内存数据移动与加速接口规范。

SDXI下的内存间数据移动 / SNIA
截至目前,不少内存厂商和服务器厂商都已经加入了对SDXI的贡献行列中来,比如AMD、Arm、戴尔、HPE、IBM,以及美光、三星、SK海力士等。他们也在考虑在1.0标准之后,继续从QoS、延迟、RAS上加以改进,在实现未来版本前向与后向兼容的同时,一起推动SDXI在CXL系统架构中的普及。
小结
在ARM、RISC-V纷纷入局数据中心,并推出百核、千核的CPU处理器后,更快的数据交换将成为一个必然的需求,未来的网络与存储技术也需要SDXI提供这样的扩展性。何况SDXI提供的不仅仅是加速,还是一个标准化接口,在满足数据移动性能的同时,支持软件爱你的重复利用和虚拟化。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
发布评论请先 登录
相关推荐
热点推荐
无线快充技术,国内首个统一标准发布
电子发烧友报道(文/李弯弯)近日,中国通信标准化协会与电信终端产业协会联合宣布,《移动终端融合快速充电 无线充电技术要求》团体标准正式发布,该标准由中国信通院联合国内主流终端与芯片企业
64GT/s+8000MT/s:澜起CXL 3.1芯片破解数据中心内存瓶颈
。 M88MX6852:性能卓越,满足多元需求 M88MX6852芯片全面支持CXL.mem和CXL.io协议,其核心使命是为下一代数据中心服务器打造更高带宽、更低延迟的内存扩展和池化解决方案。在
澜起科技推出CXL® 3.1内存扩展控制器,助力下一代数据中心基础设施性能升级
下一代数据中心服务器提供更高带宽、更低延迟的内存扩展和池化解决方案。 澜起科技CXL 3.1内存扩展控制器采用PCIe® 6.2物理层接口,支持最高64 GT/s的传输速率(x8通道),并具备多速率
新思科技解读CXL 3.1标准
Compute Express Link(CXL)于2019年首次发布,是处理器与AI加速器、内存缓冲区、智能网络接口卡、持久性存储器和固态驱动器等设备之间的开放式行业标准互连技术。作为一种行业
芯盾时代助力中国矿产资源集团构建统一认证系统
合作,芯盾时代将为中国矿产资源集团构建一个统一标准的身份标识库,实现全集团各级企业应用系统内用户、身份、认证和权限的集中统一管理。这一系统的搭建,将极大地提升集团内部信息安全水平,确保
为什么你的设备还不够“听话”?
语音+电机控制方案让控制更智能!为什么你的设备还不够“听话”?传统家电和家居设备往往需要手动操作,而语音+电机控制方案,正是打破这一局限的钥匙:语音指令:一句话操控设备,无需动手,彻底
SMART Modular CXL AIC内存扩充卡获CXL联盟认证
联盟的权威认可。作为内存与储存领域的专业先行者,SMART Modular一直致力于为客户提供创新、可靠的解决方案。此次CXL AIC内存扩充卡的成功认证,无疑是
SMART Modular世迈科技CXL内存扩充卡获CXL联盟认证
商名单。 这一重要里程碑不仅标志着SMART Modular在CXL技术领域的领先地位,更是对其长期以来致力于高质量、高兼容性内存解决方案的肯定。CXL作为一种高性能、低延迟的互连技术
澜起科技CXL®内存扩展控制器芯片通过CXL 2.0合规性测试
公布的首批CXL 2.0合规供应商清单。 此次通过CXL 2.0合规性测试,标志着澜起科技的CXL®内存扩展控制器芯片在技术规格、互操作性和性能等方面均达到了CXL联盟制定的严格
澜起科技MXC芯片列入首批CXL 2.0合规供应商清单
近日,澜起科技研发的CXL内存扩展控制器(MXC)芯片成功通过了CXL 2.0合规性测试,列入CXL联盟公布的首批CXL 2.0合规供应商清单。这是继2023年率先列入

只靠CXL还不够,数据移动也需要统一标准
评论