0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让Ceph存储的性能飙升的原因竟然是因为它?

存储加速器 来源:YXQ 2019-07-05 15:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

‍Ceph作为一款开源的分布式存储软件解决方案,由于其功能丰富、社区活跃,在公有云和私有云环境中有着广泛的应用。

然而,由于Ceph的大规模分布式架构原因,其IO路径过长,使得其性能一直被业界所诟病。

现实中,Ceph更多用在备份和归档等性能要求不高的场景。在这种场景下,一般存储介质采用HDD,很少采用全闪存的配置。

伴随着固态盘(SSD)价格的不断走低,云提供商纷纷开始着手为客户打造具备卓越性能和高可靠性的全闪存存储。

为此,他们迫切希望获得基于 Ceph 的全闪存参考架构,并了解具体的性能表现和最佳优化实践。

英特尔®傲腾™ 技术前所未有地集高吞吐量、低延迟、高服务质量和高耐用性优势于一身,它由 3D XPoint™ 内存介质和英特尔®软件等组合而成。

这些构建模块相互配合,配合至强可扩展处理器,在降低延迟和加速系统性能方面实现了具体提升,能够全面满足工作负载对于大容量和快速存储的需求。

本篇文章将围绕 Ceph 全闪存存储系统参考架构和基于英特尔®至强®可扩展处理器的软件优化等方面,介绍Intel所取得的进展。

在本文中,将重点为您介绍Ceph 参考架构和性能结果,该架构的配置包括 RADOS 块设备(RBD)接口、英特尔®傲腾™ 技术和英特尔®至强®可扩展处理器产品家族(英特尔®至强®铂金 8180 处理器和英特尔®至强®金牌 6140 处理器)。

我们先介绍采用英特尔®傲腾™ 技术和英特尔®至强®可扩展处理器的Ceph 全闪存阵列(AFA)参考架构,然后介绍典型工作负载的性能结果和系统特性。

Intel建议Ceph AFA采用英特尔®至强®铂金 8180 处理器,它是英特尔®至强®可扩展处理器产品家族中先进的处理器。

建议使用英特尔®傲腾™ 固态盘(SSD)作为BlueStore WAL(Write-Ahead Logging) 设备,使用基于 NAND 固态盘作为数据硬盘,并使用 Mellanox 40 GbE 网络接口卡(NIC)作为高速以太网数据端口,具备最高性能(吞吐量和延迟)。它是 I/O 密集型工作负载的最佳选择。

测试系统由5个Ceph存储服务器和5个客户端节点组成。

每个存储节点配置Intel Xeon Platinum 8180处理器和384 GB内存,使用1x Intel Optane SSD DC P4800X 375GB作为BlueStore WAL设备,4x Intel SSD DC P3520 2TB作为数据驱动器,以及2x Mellanox 40 GbE NIC作为Ceph的独立集群和公共网络。

同时,每个节点均使用 Ceph 12.2.2,并且每个英特尔®固态盘 DC P3520 系列运行一个对象存储守护程序(OSD)。用于测试的 RBD 池配置有 2 个副本。

对于客户端,每个节点配置了英特尔®至强®铂金 8180 处理器、384 GB 内存和 1 个 Mellanox 40GbE 网卡。

Intel设计了四种不同的工作负载来模拟云中典型的全闪存 Ceph 集群(基于带 librbd 的 fio),其中包括 4K 随机读写和 64K 顺序读写,以分别模拟随机工作负载和顺序工作负载。对于每个测试用例,IO 性能(IOPS 或带宽)使用卷扩展数量(最大扩展到 100)来衡量,每个卷配置为 30 GB。

这些卷已预先分配,以消除 Ceph 精简配置机制的影响,获得稳定且可复制的结果。每次测试之前停止 OSD 页高速缓存,以消除页高速缓存的影响。在每个测试用例中,fio 配置了 300 秒的准备时限和 300 秒的数据采集时限。

4K随机写特性

用户空间消耗的CPU利用率为37%,占CPU总利用率的75%。分析结果显示Ceph OSD过程消耗了大部分CPU周期; CPU还有空间的可疑原因是软件线程和锁定模型实现限制了Ceph在单个节点上的扩展能力,这仍然是下一步优化工作。

4K随机写入的系统指标

4K随机读取特性

CPU利用率约为60%,其中IOWAIT约占15%,因此实际CPU消耗也约为45%;类似于随机写例。OSD磁盘的读取IOPS非常稳定在80K,40 GBbE NIC带宽约为2.1 GB/s。没有观察到明显的硬件瓶颈;疑似软件瓶颈类似于4K随机写入案例,需要进一步调查。

4K随机读取的系统指标

64K顺序写入特性

顺序写入的CPU利用率和内存消耗非常低。由于OSD复制数为2,因此NIC数据的传输带宽是接收带宽的两倍,传输带宽包括两个NIC的带宽,一个用于公共网络,一个用于群集网络,每个NIC大约1.8 GB /每个端口。OSD磁盘AWAIT时间受到严重波动,最高磁盘延迟超过4秒,而磁盘IOPS非常稳定。

64K顺序写入的系统指标

64K顺序读取特性

对于顺序读取案例,我们观察到一个NIC的带宽达到4.4 GB/s,约占总带宽的88%。顺序写入的CPU利用率和内存消耗非常低。OSD磁盘读取IOPS和延迟稳定。

64K顺序读取的系统指标

总体来看,基于英特尔Optane技术的Ceph AFA集群展示了出色的吞吐量和延迟。

64K顺序读写吞吐量分别为21,949 MB/s和8,714 MB/s(最大为40 GbE NIC)。4K随机读取吞吐量为2,453K IOPS,平均延迟为5.36 ms,而4K随机写入吞吐量为500K IOPS,平均延迟为12.79 ms。

其实自从Ceph Giant发布以来,英特尔一直与社区,生态系统和合作伙伴密切合作,一直优化Ceph的性能。下图显示了Ceph主要版本和不同Intel平台上4K随机写入工作负载的性能优化历史记录。

凭借新的Ceph主要版本,后端存储,结合核心平台变化和SSD升级,单个节点的4K随机写入性能提高了27倍(每个节点每秒输入/输出操作3,673次(IOPS)至每个节点100,052 IOPS)!

这使得使用Ceph构建高性能存储解决方案成为可能。

在本文中,我们在英特尔至强可扩展处理器上看到了采用Ceph AFA参考架构的英特尔Optane技术的性能结果。此配置展示了出色的吞吐量和延迟,除了延迟比传统的高端存储有些差距外,带宽和IOPS都达到了高端存储的水平。

对于读取密集型工作负载,尤其是小块读,对CPU性能要求比较高,建议使用英特尔至强可扩展处理器系列的顶级处理器,例如英特尔至强铂金8000系列处理器。

与采用英特尔至强可扩展处理器上的Ceph AFA集群的默认配置的英特尔Optane技术相比,软件调优和优化还为读取和写入提供了高达19%的性能提升。

由于使用当前的硬件配置可以观察到硬件性能还有净空,因此性能有望在不久的将来通过持续的Ceph优化(如RDMA messenger,NVMe-focus对象存储,async-osd等)不断改进。

相信有了英特尔®至强®可扩展处理器和傲腾™技术的支持,加上Ceph不断优化,未来Ceph的性能将会更好,Ceph也将越来越多用于主存储场景,而不仅仅是目前聚焦的第二存储场景。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    39

    文章

    7715

    浏览量

    170856
  • Ceph
    +关注

    关注

    1

    文章

    25

    浏览量

    9658

原文标题:让Ceph存储的性能飙升的原因竟然是因为它?

文章出处:【微信号:TopStorage,微信公众号:存储加速器】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    游戏卡顿元凶竟然是 Draw Call!

    本文转自:字符无限科技玩游戏时遇到画面掉帧、操作延迟,大概率和一个叫DrawCall的指标有关。它是游戏渲染的核心环节,也是性能优化绕不开的坎,哪怕是Unity、UE引擎的资深开发者,也得在身上
    的头像 发表于 11-04 10:51 242次阅读
    游戏卡顿元凶<b class='flag-5'>竟然是</b> Draw Call!

    Ceph集群部署与运维完全指南

    作为一名资深运维工程师,我见证了太多企业在存储架构选型上的纠结。传统的NAS/SAN方案成本高昂,扩展性差;而云存储又面临厂商锁定的风险。直到我深入研究Ceph后,才真正理解什么叫"软件定义
    的头像 发表于 08-29 17:18 978次阅读

    电容液位计不准确竟是因为

    液位计
    jzyb
    发布于 :2025年08月25日 13:58:48

    K8s存储类设计与Ceph集成实战

    在云原生时代,存储是制约应用性能的关键瓶颈。本文将带你深入理解K8s存储类的设计原理,并手把手实现与Ceph的完美集成,你的集群
    的头像 发表于 08-22 11:50 602次阅读

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式存储系统应运而生,而Ceph作为开源分布式
    的头像 发表于 07-14 11:15 715次阅读

    充电桩出海,缩短三个月项目周期,竟是因为

    全部实现 但该模组无 CE 认证 致使整机认证时间拉长 项目出海受阻 客户急需性能稳定、认证齐全的方案 便找到了安信可的科技 Rd-03 模组 安信可推出的Rd-03人体感应雷达模组 凭借完整的CE、FCC认证、出色的产品性能与售后服务支持 等优势脱颖而
    的头像 发表于 05-28 11:45 417次阅读
    充电桩出海,缩短三个月项目周期,竟<b class='flag-5'>是因为</b><b class='flag-5'>它</b>?

    你失去工作不是因为AI,而是因为使用AI的人

    当算法能精准预测消费者需求时,当AI生成的文案比人类更懂传播心理学时,当自动化系统开始取代基础决策岗位时,真正的危机已悄然降临—— 不是AI在抢夺你的工作,而是那些比你更早掌握AI、更懂得如何驾驭AI的人,正在重新定义职场规则 。这场变革的本质,是人与技术协同能力的代际更替,而多数人尚未意识到: 被淘汰的从来不是工具,而是不会使用工具的人。 一、问题:技术平权背后的能力鸿沟 人工智能的普及本应带来“技术平权”——每个
    的头像 发表于 05-13 12:05 612次阅读
    你失去工作不<b class='flag-5'>是因为</b>AI,而<b class='flag-5'>是因为</b>使用AI的人

    UPS(不间断电源)故障频发?原因竟然是这样

    UPS(不间断电源)故障频发?原因竟然是这样
    的头像 发表于 04-19 13:53 1369次阅读
    UPS(不间断电源)故障频发?<b class='flag-5'>原因</b><b class='flag-5'>竟然是</b>这样

    纹波异常的原因竟然是这个!!

    的EMI性能。【应用】音响电源【规格】12V2A【问题描述】:纹波异常客户描述纹波有异常的尖刺,测试输出纹波发现确实有尖刺,总体纹波高达360mV把示波器时间调快
    的头像 发表于 04-15 09:53 680次阅读
    纹波异常的<b class='flag-5'>原因</b><b class='flag-5'>竟然是</b>这个!!

    性能飙升!使用Python并行计算榨干树莓派算力!

    Deepseek的引爆,AI大模型的本地化部署并应用于实际项目中变为可能。开发者们意识到——除了提升硬件性能,边缘设备的算力优化也是未来趋势!当全球创客都在用树莓派搭建智能家居中枢、AI监控系统
    的头像 发表于 03-26 17:08 691次阅读
    <b class='flag-5'>让</b><b class='flag-5'>性能</b><b class='flag-5'>飙升</b>!使用Python并行计算榨干树莓派算力!

    芜湖,起飞!树莓派性能飙升的小秘诀~

    今天给大家分享一个超棒的内容。这里面有超多树莓派性能提升的小技巧哦。如果你是树莓派爱好者,那这个文章绝对不能错过。详细地介绍了各种实用的方法,可以你的树莓派发挥出更大的潜力。无论是提高运行
    的头像 发表于 03-25 09:33 691次阅读
    芜湖,起飞!<b class='flag-5'>让</b>树莓派<b class='flag-5'>性能</b><b class='flag-5'>飙升</b>的小秘诀~

    ads1232获取的数据中经常有一些比较大的值或者一些错误值,这个是因为什么原因

    数据中经常有一些比较大的值 或者一些错误值,这个是因为什么原因。最后8位数据一致在跳动,是不是我的基准电压不够稳定。 -----85b1----- -----858d-----
    发表于 01-08 08:19

    TLC2543的输出结果应为带符号二进制格式的数据,现在输出的结果为不带符号的二进制数,这是因为什么原因

    的电压值分别为2.48V,2.98V,0.95V。使用逻辑分析仪对TLC2543的CS,CLK,MOSI,MISO进行分析得到图中结果。 TLC2543的输出结果应为带符号二进制格式的数据,现在输出的结果为不带符号的二进制数,这是因为什么原因
    发表于 12-27 07:46

    EMMC存储如何影响设备性能

    基于NAND闪存的存储技术,集成了控制器和NAND闪存在一个单一的封装中。与传统的SD卡或eMMC相比,EMMC提供了更高的数据传输速率和更低的功耗。EMMC的版本从4.41到5.1不等,每个版本都有不同的性能和特性。 1.
    的头像 发表于 12-25 09:40 3004次阅读

    EMMC存储技术的优缺点

    EMMC存储技术的优点 1. 高性能 EMMC存储技术以其高性能而闻名。使用高速的串行接口,如HS400或HS200,能够提供高达400M
    的头像 发表于 12-25 09:23 3431次阅读