0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何利用Intel的傲腾技术和CPU提升Ceph性能

高端存储知识 来源:xx 2019-06-29 10:49 次阅读

Ceph是最常见的块和对象存储后端解决方案,现在新版本也加入了文件的支持。作为一款开源的分布式存储软件解决方案,由于其功能丰富,社区活跃,它在公有云和私有云环境中有着广泛的应用。

然而,由于Ceph的大规模分布式架构原因,其IO路径过长,使得其性能一直被业界所诟病。现实中,Ceph更多用在备份和归档等性能要求不高的场景。在这种场景下,一般存储介质采用HDD,很少采用全闪存的配置。

伴随着固态盘(SSD)价格的不断走低,云提供商纷纷开始着手为客户打造具备卓越性能和高可靠性的全闪存存储。为此,他们迫切希望获得基于 Ceph 的全闪存参考架构,并了解具体的性能表现和最佳优化实践。

英特尔® 傲腾™ 技术前所未有地集高吞吐量、低延迟、高服务质量和高耐用性优势于一身,它由 3D XPoint™ 内存介质和英特尔® 软件等组合而成。这些构建模块相互配合,配合至强可扩展处理器,在降低延迟和加速系统性能方面实现了具体提升,能够全面满足工作负载对于大容量和快速存储的需求。

本篇文章将围绕 Ceph 全闪存存储系统参考架构和基于英特尔® 至强® 可扩展处理器的软件优化等方面,介绍Intel所取得的进展。在本文中,将重点为您介绍Ceph 参考架构和性能结果,该架构的配置包括 RADOS 块设备(RBD)接口、英特尔® 傲腾™ 技术和英特尔® 至强® 可扩展处理器产品家族(英特尔® 至强® 铂金 8180 处理器和英特尔® 至强® 金牌 6140 处理器)。

我们先介绍采用英特尔® 傲腾™ 技术和英特尔® 至强® 可扩展处理器的 Ceph 全闪存阵列(AFA)参考架构,然后介绍典型工作负载的性能结果和系统特性。

Intel建议Ceph AFA采用英特尔® 至强® 铂金 8180 处理器,它是英特尔® 至强® 可扩展处理器产品家族中先进的处理器。建议使用英特尔® 傲腾™ 固态盘(SSD)作为BlueStore WAL(Write-Ahead Logging) 设备,使用基于 NAND 固态盘作为数据硬盘,并使用 Mellanox 40 GbE 网络接口卡(NIC)作为高速以太网数据端口,具备最高性能(吞吐量和延迟)。它是 I/O 密集型工作负载的最佳选择。

测试系统由五个Ceph存储服务器和五个客户端节点组成。每个存储节点配置Intel Xeon Platinum 8180处理器和384 GB内存,使用1x Intel Optane SSD DC P4800X 375GB作为BlueStore WAL设备,4x Intel® SSD DC P3520 2TB作为数据驱动器,以及2x Mellanox 40 GbE NIC作为Ceph的独立集群和公共网络。

同时,每个节点均使用 Ceph 12.2.2,并且每个英特尔® 固态盘 DC P3520 系列运行一个对象存储守护程序(OSD)。用于测试的 RBD 池配置有 2 个副本。

对于客户端,每个节点配置了英特尔® 至强® 铂金 8180 处理器、384 GB 内存和 1 个 Mellanox 40GbE NIC。

Intel设计了四种不同的工作负载来模拟云中典型的全闪存 Ceph 集群(基于带 librbd 的 fio),其中包括 4K 随机读写和 64K 顺序读写,以分别模拟随机工作负载和顺序工作负载。对于每个测试用例,IO 性能(IOPS 或带宽)使用卷扩展数量(最大扩展到 100)来衡量,每个卷配置为 30 GB。这些卷已预先分配,以消除 Ceph 精简配置机制的影响,获得稳定且可复制的结果。每次测试之前停止 OSD 页高速缓存,以消除页高速缓存的影响。在每个测试用例中,fio 配置了 300 秒的准备时限和 300 秒的数据采集时限。

4K随机写特性

用户空间消耗的CPU利用率为37%,占CPU总利用率的75%。分析结果显示Ceph OSD过程消耗了大部分CPU周期; CPU还有空间的可疑原因是软件线程和锁定模型实现限制了Ceph在单个节点上的扩展能力,这仍然是下一步优化工作。

4K随机写入的系统指标

4K随机读取特性

CPU利用率约为60%,其中IOWAIT约占15%,因此实际CPU消耗也约为45%;类似于随机写例。OSD磁盘的读取IOPS非常稳定在80K,40 GBbE NIC带宽约为2.1 GB/s。没有观察到明显的硬件瓶颈;疑似软件瓶颈类似于4K随机写入案例,需要进一步调查。

4K随机读取的系统指标

64K顺序写入特性

顺序写入的CPU利用率和内存消耗非常低。由于OSD复制数为2,因此NIC数据的传输带宽是接收带宽的两倍,传输带宽包括两个NIC的带宽,一个用于公共网络,一个用于群集网络,每个NIC大约1.8 GB /每个端口。OSD磁盘AWAIT时间受到严重波动,最高磁盘延迟超过4秒,而磁盘IOPS非常稳定。

64K顺序写入的系统指标

64K顺序读取特性

对于顺序读取案例,我们观察到一个NIC的带宽达到4.4 GB/s,约占总带宽的88%。顺序写入的CPU利用率和内存消耗非常低。OSD磁盘读取IOPS和延迟稳定。

64K顺序读取的系统指标

总体来看,基于英特尔Optane技术的Ceph AFA集群展示了出色的吞吐量和延迟。64K顺序读写吞吐量分别为21,949 MB/s和8,714 MB/s(最大为40 GbE NIC)。4K随机读取吞吐量为2,453K IOPS,平均延迟为5.36 ms,而4K随机写入吞吐量为500K IOPS,平均延迟为12.79 ms。

其实自从Ceph Giant发布以来,英特尔一直与社区,生态系统和合作伙伴密切合作,一直优化Ceph的性能。下图显示了Ceph主要版本和不同Intel平台上4K随机写入工作负载的性能优化历史记录。凭借新的Ceph主要版本,后端存储,结合核心平台变化和SSD升级,单个节点的4K随机写入性能提高了27倍(每个节点每秒输入/输出操作3,673次(IOPS)至每个节点100,052 IOPS)!这使得使用Ceph构建高性能存储解决方案成为可能。

在本文中,我们在英特尔至强可扩展处理器上看到了采用Ceph AFA参考架构的英特尔Optane技术的性能结果。此配置展示了出色的吞吐量和延迟。除了延迟比传统的高端存储有些差距外,带宽和IOPS都达到了高端存储的水平。

对于读取密集型工作负载,尤其是小块读,对CPU性能要求比较高,建议使用英特尔至强可扩展处理器系列的顶级处理器,例如英特尔至强铂金8000系列处理器。与采用英特尔至强可扩展处理器上的Ceph AFA集群的默认配置的英特尔Optane技术相比,软件调优和优化还为读取和写入提供了高达19%的性能提升。由于使用当前的硬件配置可以观察到硬件性能还有净空,因此性能有望在不久的将来通过持续的Ceph优化(如RDMA messenger,NVMe-focus对象存储,async-osd等)不断改进。

相信有了Intel至强可扩展处理器和傲腾技术的支持,加上Ceph不断优化,未来Ceph的性能将会更好,Ceph也将越来越多用于主存储场景,而不仅仅是目前聚焦的第二存储场景。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10435

    浏览量

    206523
  • intel
    +关注

    关注

    19

    文章

    3451

    浏览量

    184769
  • Ceph
    +关注

    关注

    1

    文章

    21

    浏览量

    9362

原文标题:如何利用Intel的傲腾技术和CPU提升Ceph性能?

文章出处:【微信号:High-end_Storage,微信公众号:高端存储知识】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    游最新版

    版本,整体性能提升在30%以上,无论是解析网页还是程序响应均有可感知的显著提升。全新侧边栏游3.1正式版增加了具有Aero效果的侧边栏,具有极强烈的视觉效果。依托侧边栏,
    发表于 06-23 14:03

    16年的笔记本主板上竟然有内存接口!

    `有同款笔记本的吗?(戴尔灵越5567)我发现主板后面有一个ssd固态的排线底座没有焊上去!我仔细看了一下丝印上标的是JSSD1是固态排线没错,但引脚上写的OPTANE难道是内存?有没有哪位大佬有办法可以利用一下这个接口?`
    发表于 08-26 12:09

    基于RDMA技术的Spark Shuffle性能提升

    一篇文章教你使用RDMA技术提升Spark的Shuffle性能
    发表于 10-28 16:46

    多核和多线程技术怎么提升Android网页浏览性能

    采用多核技术提升 CPU 马力,是一种通过硬件提供更高系统性能的日益常见的做法。即使对许多视成本和功耗为重要设计考虑的大量消费性应用,也是如此。但是,升级到多核系统并无法保证一定能够
    发表于 03-25 08:08

    Intel发布H10混合固态盘:速度提升2倍 精选资料分享

    Intel Optane储技术已经有了多种多样的产品样式,比如消费级领域的M.2快取加速硬盘(M10)、M.2主流固态硬盘(800p)、M.2/U.2/AIC高阶固态硬盘(900p/905p),还有
    发表于 07-26 08:06

    基于全HDD aarch64服务器的Ceph性能调优实践总结

    1 简介作为一个统一的分布式存储系统,Ceph为应用程序提供了对象,块和文件系统接口。考虑到TCO,我们搭建了一个全HDD的Ceph集群(每个节点11个HDD + 1个SSD),它在存储利用率,
    发表于 07-05 14:26

    Ceph是什么?Ceph的统一存储方案简析

    Ceph是什么?Ceph是一个开源的分布式存储系统,可大规模扩展、高性能、无单点故障,在普通的服务器上可以支持到PB级容量,商用机器上支持的容量可以达到EB级别。Ceph的竞争力市面上
    发表于 10-08 15:40

    如何利用Intel Optanane技术优化资本市场

    如何利用Intel Optanane技术优化资本市场——金融信息技术生命中的一天,描述Intelé OptananeTM
    发表于 08-04 06:30

    Intel CPU

    Intel CPU   从奔腾时代开始,Intel(英特尔)推出了专用于服务器的CPU——Pentium Pro
    发表于 12-18 11:52 573次阅读

    CPU工艺提升性能也会提升

    半导体的支持工艺和CPU性能关系就大了,它关系到CPU内能塞进多少个晶体管,还有CPU所能达到的频率还有它的功耗,1978年Intel推出
    的头像 发表于 04-03 09:14 3242次阅读

    双路CPU可让性能轻松翻倍,AMD和Intel为什么不做

    如何提升CPU性能?这个问题是摆在AMD及Intel两家X86处理器主导者面前的头等大事,升制程、改架构、提频率都是提高CPU
    的头像 发表于 12-26 08:48 2.4w次阅读

    AMD和Intel为什么不推出双路CPU

    如何提升CPU性能?这个问题是摆在AMD及Intel两家X86处理器主导者面前的头等大事,升制程、改架构、提频率都是提高CPU
    发表于 12-26 09:55 2733次阅读

    intel 11代CPU性能全方位大提升

    新架构的11代酷睿处理器相较于上一代产品在IPC有19%的提升、核芯显卡性能有着50%的提升并具有着更强的深度学习性能,另外还支持AVX512指令集。另外,
    的头像 发表于 06-01 17:26 3831次阅读
    <b class='flag-5'>intel</b> 11代<b class='flag-5'>CPU</b>,<b class='flag-5'>性能</b>全方位大<b class='flag-5'>提升</b>!

    华为BoostKit 全局缓存技术实现Ceph存储性能的10倍提升

    本次直播主要讲解鲲鹏应用使能套件BoostKit的分布式存储全局缓存(Global Cache)技术:通过创新的解耦架构设计、核心算法突破以及全路径的硬件亲和优化,在相同硬件条件和数据可靠性要求下,实现Ceph存储性能的10倍
    的头像 发表于 12-16 17:00 2314次阅读

    利用封装、IC和GaN技术提升电机驱动性能

    利用封装、IC和GaN技术提升电机驱动性能
    的头像 发表于 11-23 16:21 268次阅读
    <b class='flag-5'>利用</b>封装、IC和GaN<b class='flag-5'>技术</b><b class='flag-5'>提升</b>电机驱动<b class='flag-5'>性能</b>