0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让Ceph存储的性能飙升的原因竟然是因为它?

存储加速器 来源:YXQ 2019-07-05 15:11 次阅读

‍Ceph作为一款开源的分布式存储软件解决方案,由于其功能丰富、社区活跃,在公有云和私有云环境中有着广泛的应用。

然而,由于Ceph的大规模分布式架构原因,其IO路径过长,使得其性能一直被业界所诟病。

现实中,Ceph更多用在备份和归档等性能要求不高的场景。在这种场景下,一般存储介质采用HDD,很少采用全闪存的配置。

伴随着固态盘(SSD)价格的不断走低,云提供商纷纷开始着手为客户打造具备卓越性能和高可靠性的全闪存存储。

为此,他们迫切希望获得基于 Ceph 的全闪存参考架构,并了解具体的性能表现和最佳优化实践。

英特尔®傲腾™ 技术前所未有地集高吞吐量、低延迟、高服务质量和高耐用性优势于一身,它由 3D XPoint™ 内存介质和英特尔®软件等组合而成。

这些构建模块相互配合,配合至强可扩展处理器,在降低延迟和加速系统性能方面实现了具体提升,能够全面满足工作负载对于大容量和快速存储的需求。

本篇文章将围绕 Ceph 全闪存存储系统参考架构和基于英特尔®至强®可扩展处理器的软件优化等方面,介绍Intel所取得的进展。

在本文中,将重点为您介绍Ceph 参考架构和性能结果,该架构的配置包括 RADOS 块设备(RBD)接口、英特尔®傲腾™ 技术和英特尔®至强®可扩展处理器产品家族(英特尔®至强®铂金 8180 处理器和英特尔®至强®金牌 6140 处理器)。

我们先介绍采用英特尔®傲腾™ 技术和英特尔®至强®可扩展处理器的Ceph 全闪存阵列(AFA)参考架构,然后介绍典型工作负载的性能结果和系统特性。

Intel建议Ceph AFA采用英特尔®至强®铂金 8180 处理器,它是英特尔®至强®可扩展处理器产品家族中先进的处理器。

建议使用英特尔®傲腾™ 固态盘(SSD)作为BlueStore WAL(Write-Ahead Logging) 设备,使用基于 NAND 固态盘作为数据硬盘,并使用 Mellanox 40 GbE 网络接口卡(NIC)作为高速以太网数据端口,具备最高性能(吞吐量和延迟)。它是 I/O 密集型工作负载的最佳选择。

测试系统由5个Ceph存储服务器和5个客户端节点组成。

每个存储节点配置Intel Xeon Platinum 8180处理器和384 GB内存,使用1x Intel Optane SSD DC P4800X 375GB作为BlueStore WAL设备,4x Intel SSD DC P3520 2TB作为数据驱动器,以及2x Mellanox 40 GbE NIC作为Ceph的独立集群和公共网络。

同时,每个节点均使用 Ceph 12.2.2,并且每个英特尔®固态盘 DC P3520 系列运行一个对象存储守护程序(OSD)。用于测试的 RBD 池配置有 2 个副本。

对于客户端,每个节点配置了英特尔®至强®铂金 8180 处理器、384 GB 内存和 1 个 Mellanox 40GbE 网卡。

Intel设计了四种不同的工作负载来模拟云中典型的全闪存 Ceph 集群(基于带 librbd 的 fio),其中包括 4K 随机读写和 64K 顺序读写,以分别模拟随机工作负载和顺序工作负载。对于每个测试用例,IO 性能(IOPS 或带宽)使用卷扩展数量(最大扩展到 100)来衡量,每个卷配置为 30 GB。

这些卷已预先分配,以消除 Ceph 精简配置机制的影响,获得稳定且可复制的结果。每次测试之前停止 OSD 页高速缓存,以消除页高速缓存的影响。在每个测试用例中,fio 配置了 300 秒的准备时限和 300 秒的数据采集时限。

4K随机写特性

用户空间消耗的CPU利用率为37%,占CPU总利用率的75%。分析结果显示Ceph OSD过程消耗了大部分CPU周期; CPU还有空间的可疑原因是软件线程和锁定模型实现限制了Ceph在单个节点上的扩展能力,这仍然是下一步优化工作。

4K随机写入的系统指标

4K随机读取特性

CPU利用率约为60%,其中IOWAIT约占15%,因此实际CPU消耗也约为45%;类似于随机写例。OSD磁盘的读取IOPS非常稳定在80K,40 GBbE NIC带宽约为2.1 GB/s。没有观察到明显的硬件瓶颈;疑似软件瓶颈类似于4K随机写入案例,需要进一步调查。

4K随机读取的系统指标

64K顺序写入特性

顺序写入的CPU利用率和内存消耗非常低。由于OSD复制数为2,因此NIC数据的传输带宽是接收带宽的两倍,传输带宽包括两个NIC的带宽,一个用于公共网络,一个用于群集网络,每个NIC大约1.8 GB /每个端口。OSD磁盘AWAIT时间受到严重波动,最高磁盘延迟超过4秒,而磁盘IOPS非常稳定。

64K顺序写入的系统指标

64K顺序读取特性

对于顺序读取案例,我们观察到一个NIC的带宽达到4.4 GB/s,约占总带宽的88%。顺序写入的CPU利用率和内存消耗非常低。OSD磁盘读取IOPS和延迟稳定。

64K顺序读取的系统指标

总体来看,基于英特尔Optane技术的Ceph AFA集群展示了出色的吞吐量和延迟。

64K顺序读写吞吐量分别为21,949 MB/s和8,714 MB/s(最大为40 GbE NIC)。4K随机读取吞吐量为2,453K IOPS,平均延迟为5.36 ms,而4K随机写入吞吐量为500K IOPS,平均延迟为12.79 ms。

其实自从Ceph Giant发布以来,英特尔一直与社区,生态系统和合作伙伴密切合作,一直优化Ceph的性能。下图显示了Ceph主要版本和不同Intel平台上4K随机写入工作负载的性能优化历史记录。

凭借新的Ceph主要版本,后端存储,结合核心平台变化和SSD升级,单个节点的4K随机写入性能提高了27倍(每个节点每秒输入/输出操作3,673次(IOPS)至每个节点100,052 IOPS)!

这使得使用Ceph构建高性能存储解决方案成为可能。

在本文中,我们在英特尔至强可扩展处理器上看到了采用Ceph AFA参考架构的英特尔Optane技术的性能结果。此配置展示了出色的吞吐量和延迟,除了延迟比传统的高端存储有些差距外,带宽和IOPS都达到了高端存储的水平。

对于读取密集型工作负载,尤其是小块读,对CPU性能要求比较高,建议使用英特尔至强可扩展处理器系列的顶级处理器,例如英特尔至强铂金8000系列处理器。

与采用英特尔至强可扩展处理器上的Ceph AFA集群的默认配置的英特尔Optane技术相比,软件调优和优化还为读取和写入提供了高达19%的性能提升。

由于使用当前的硬件配置可以观察到硬件性能还有净空,因此性能有望在不久的将来通过持续的Ceph优化(如RDMA messenger,NVMe-focus对象存储,async-osd等)不断改进。

相信有了英特尔®至强®可扩展处理器和傲腾™技术的支持,加上Ceph不断优化,未来Ceph的性能将会更好,Ceph也将越来越多用于主存储场景,而不仅仅是目前聚焦的第二存储场景。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7151

    浏览量

    162002
  • Ceph
    +关注

    关注

    1

    文章

    21

    浏览量

    9362

原文标题:让Ceph存储的性能飙升的原因竟然是因为它?

文章出处:【微信号:TopStorage,微信公众号:存储加速器】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    手机出问题的元凶找到了!万万没想到,竟然是因为!#esd# 保护器件

    保护器件半导体元器件
    萨瑞微电子
    发布于 :2024年04月15日 16:07:27

    使用tc397进行收发的时候没有响应是因为什么?

    在使用 tc397 进行收发的时候,发现没有响应,代码是根据示例代码修改,通过逻辑分析仪和示波器进行调试的 只修改了对应的 tx,rx 引脚,请问可能是因为什么原因
    发表于 03-05 07:45

    IBM积极推进Ceph扩展,以打造AI领域的底层数据存储基石

    BM正着手扩展Ceph的块和文件存储功能,希望将其定位为Storage Scale并行文件系统之下面向AI工作负载的后端数据存储
    发表于 02-20 16:15 138次阅读

    N9H20 GPIO上电竟然是高电平,有没有办法解决?

    一直很纳闷,GPIO上电竟然是高电平。有没有办法解决,是不是要改动启动程序才能解决问题?
    发表于 01-17 08:27

    请问怎样使用cephadm部署ceph集群呢?

    从红帽ceph5开始使用cephadm代替之前的ceph-ansible作为管理整个集群生命周期的工具,包括部署,管理,监控。
    的头像 发表于 01-16 09:32 354次阅读
    请问怎样使用cephadm部署<b class='flag-5'>ceph</b>集群呢?

    锡膏不上锡是因为活性不足吗?

    众所周知,有时候锡膏不上锡是因为活性不足,还有人会说活性越多越好。有时候锡膏不挂锡是因为活性不足吗。这样的话,你会觉得锡膏的活性越高越好吗?下一步由深圳锡膏厂家为大家分析一下:大家都知道锡膏中有许多
    的头像 发表于 01-04 15:46 247次阅读
    锡膏不上锡<b class='flag-5'>是因为</b>活性不足吗?

    锂电池高温存储性能衰减原因

    锂电池高温存储性能衰减原因  锂电池作为一种重要的能量存储技术,在手机、电动车等众多领域得到了广泛应用。然而,锂电池在高温环境下的存储
    的头像 发表于 12-08 16:05 1005次阅读

    【飞腾派4G版免费试用】第一篇:开箱见面和资料下载

    ://www.phytium.com.cn/ 3、 找到飞腾派的主页 4、 拉到最底端,能够清晰的看到产品与资料的获取。官网不能下载自己的资料,竟然是外部链接,这是我万万没想到的啊(我就是因为这点才发表一个资料的下载
    发表于 12-05 14:10

    你不知道的FPC,它的发展史竟然是这样的!

    你不知道的FPC,它的发展史竟然是这样的!
    的头像 发表于 11-15 10:48 458次阅读

    stlink无法识别是因为什么?

    stlink无法识别是因为什么
    发表于 10-31 06:40

    程序员节 | 今年程序员们都想要的礼物竟然是……

    原文标题:程序员节 | 今年程序员们都想要的礼物竟然是…… 文章出处:【微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。
    的头像 发表于 10-24 10:35 269次阅读
    程序员节 | 今年程序员们都想要的礼物<b class='flag-5'>竟然是</b>……

    Ceph分布式存储简介&amp;Ceph数据恢复流程

    Ceph存储可分为块存储,对象存储和文件存储Ceph基于对象
    的头像 发表于 09-26 15:41 442次阅读

    电阻失效,竟然是惹的祸!

    电路电容DIY
    学习电子知识
    发布于 :2023年09月05日 21:14:03

    频繁FullGC的原因竟然是开源代码?

    首先 java 语言的特性是不需像 C 和 C++ 那样自己手动释放内存,因为 java 本身有垃圾回收机制(垃圾回收称为 GC),顾名思义就是释放垃圾占用的空间,防止内存泄露。
    的头像 发表于 07-30 15:56 708次阅读
    频繁FullGC的<b class='flag-5'>原因</b><b class='flag-5'>竟然是</b>开源代码?

    SDNLAB技术分享:Ceph在云英的实践

    Ceph是最近开源系统中很火的一个项目,基于Sage Weil的一片博士论文发展而来的一个分布式文件系统,可提供PB级,动态可扩展,数据安全可靠的存储服务。Ceph提供分布式存储服务包
    发表于 06-16 09:32 261次阅读
    SDNLAB技术分享:<b class='flag-5'>Ceph</b>在云英的实践