0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高效管理海量数据!忆联 SSD 为分布式块存储提供极致性能

UnionMemory忆联 来源:未知 2023-10-13 15:55 次阅读

近年来,为满足大规模的存储应用需求,分布式存储成为云环境下存储底座构建的重要选择,相较于传统集中式存储方案的可靠性、安全性以及数据利用率较低,分布式存储具有易扩展、高性能、高性价比、支持分级存储、多副本一致性及存储系统标准化等优势。

块存储作为分布式存储的一部分,主要为计算集群虚拟机、容器提供弹性卷服务,而弹性卷 EVS 则是当前云业务平台最核心的存储服务,对存储性能要求极高,基于此,各大云厂商基本采用全闪化形态部署。

Ceph 则是当前业界应用最广泛的开源分布式存储软件,凭借高扩展性、高性能、高可靠等特点,同时支持块存储、文件存储及对象存储接口,已成熟应用于云计算的 IAAS 平台。为更好地助力分布式块存储系统性能及可靠性的提升,忆联在 Ceph 平台下开展实测,本文为此次的测试结论。

一、Ceph 简介

Ceph 是一个统一的分布式存储系统,可提供较好性能、可靠性和扩展性,是面向云计算领域重要的底层存储系统,已在国内运营商、政府、金融、互联网等多个行业落地应用。

wKgZomUt2-WAEOZiAAMho7IhY24568.png

图 1:Ceph 技术架构图

Ceph 主要分为应用接口层、存储基础接口层、存储对象层。接口层主要负责客户端访问,分为本地语言绑定接口、块存储设备接口和文件系统接口,展现了 Ceph 统一性。

在 Ceph 块存储系统中,数据以块的形式存在卷里,块为应用程序提供大存储容量,可靠性和性能都更高,卷可映射到操作系统中,由文件系统层控制。Ceph 块存储系统引入的 RBD(Ceph 块设备)协议为客户端提供了高可靠、高性能、分布式的块存储,同时 RBD 也支持其他的企业级特性,例如完整和增量式快照,精简的配置,写时复制( copy-on-write)式克隆,以及全内存式缓存等,从而大大提高了系统的性能。

wKgZomUt2-WAFuTbAAA6dhTKhGc063.png

图 2:Ceph 块存储组件

二、忆联 Ceph 存储方案验证

1.验证环境

1.1 本次验证硬件配置

wKgZomUt2-WAU48JAAINxIv62uQ637.png

1.2本次验证软件配置

wKgZomUt2-WAAaPRAAE3di4pbGc166.png

1.3本次验证组网规划

wKgZomUt2-WAGSE4AAFnitdjqbs692.png

图 3:Ceph 组网规划架构图

2、验证方法

步骤 1:创建 RBD pool 和 RBD 卷。配置参数 osd_pool_default_size 确定 RBD Pool 池的副本数,2 表示两幅本,3 表示三副本,根据实际副本数需求,将该配置项添加到 ceph.conf 中即可。另外根据规划,需要创建 60 个大小为 100GiB 的 RBD 卷进行 IO 测试。

步骤 2:下发 IO 测试前,需对服务器和客户端的 IO、CPU网络进行监控,每 2 秒采集一次数据。

步骤 3:在 6 个客户端上同时对 60 个 RBD 卷下发 IO,每个客户端均需绑核,即每个 fio 绑定不同 cpu 核。

步骤 4:完成 IO 测试后,需关闭服务端和客户端的 IO、CPU、网络进行监控。

步骤 5:测试完成后,需汇总所有客户端 fio 的 BW、IOPS、平均时延,汇总对应的监控数据。对于 BW 和 IOPS,累加各 FIO 对应结果即可;对于平均时延,累加之后需求平均值。

3、验证结果

本次在 Ceph 场景下验证结果如下:

①、忆联 UH8 系 SSD 在随机读及顺序读下的表现。

wKgZomUt2-WAcn6mAAFEYTOu4Lo192.png

图 4:Ceph 场景下忆联 UH8 系 SSD 读性能

从图 4 可以看出,在 Ceph 分布式存储系统下,不论是二副本还是三副本,忆联 UH8 系 SSD 的读性能基本持平。在时延方面,二副本与三副本趋势基本一致,1QD 至 32QD 间较为稳定,在 32QD 后时延明显增加。

②、忆联 UH8 系 SSD 在随机写及顺序写下的表现。

wKgZomUt2-WAQL2pAAEqCd2OFCU196.png

图 5:Ceph 场景下忆联 UH8 系 SSD 写性能

如图 5 所示,不论是在随机写还是在顺序写业务下,二副本写性能远高于三副本性能,主要是由于副本复制带来的网络及存储开销,造成三副本写带宽及写 IOPS 下降明显。在总体时延表现上,二副本明显优于三副本。在时延变化趋势上,二副本与三副本基本一致,皆在 32QD 后有比较显著的上升。

③、忆联 UH8 系 SSD 在混合读写场景下的表现。

wKgZomUt2-aAKtOaAAGh4kV_Pzo257.png

图 6:Ceph 场景下忆联 UH8 系 SSD 混合读写性能

从图 6 可以看出,在 4K 7:3 混合读写业务场景下,从 16QD 起,二副本 IOPS 性能优于三副本。在时延整体表现上,二副本低于三副本,但在时延变化趋势上,二副本与三副本基本一致,时延从 32QD 起,明显上升。

小结:从 Ceph 读、写、混合读写业务场景的实测数据中,可以看到忆联 SSD 整体表现优秀,可为 Ceph 环境提供极致存储性能。在时延上,忆联 SSD 在 32QD 及以下场景中,表现亮眼,可获得更佳的时延体验。

④、智能多流降 WA,有效提升 SSD 寿命

为更好解决读写机制带来的写放大而造成的 SSD 性能损耗及使用寿命缩短,忆联推出 SSD 的智能多流特性,通过智能冷热数据分类算法,有效提高 GC(垃圾回收)时的效率,减少写放大,提升 SSD 性能。

wKgZomUt2-aAVMDQAAC9ZURlGYY805.png

图 7:Ceph 场景下智能多流特性测试

在 Ceph 方案中,基于标准 JESD 219 业务模型,针对 SSD 分别开启、关闭智能多流进行写放大测试,通过图 7 对比验证结果可以看到忆联智能多流(IMS)开启后,SSD 写放大降低 20%+,极大提升了 SSD 寿命。

本次验证证明了忆联 SSD 在 Ceph 分布式存储系统中的稳定性能,可有效支撑 Ceph 的存储需求,为 Ceph 提供始终如一的高性能,成为软件定义存储解决方案最优的选择。同时,忆联 SSD 独有的智能多流技术可降低分布式存储场景下 SSD 写放大,提升 SSD 寿命,帮助用户减少总体 TCO。对于 Ceph 分布式存储系统而言,忆联 SSD 是一个可真正做到高性能、高可靠、低成本的存储解决方案。

wKgZomUt2-aAapEdAABbOPPgAIU973.jpg

长按识别关注更多忆联资讯

了解更多:

下一代ZNS?浅谈FDP在企业级SSD应用前景

国庆特辑|忆联SSD通过极端压力中子实验,为数字中国建设提质增速

忆联UH711a获红帽生态系统认证,成功入选红帽生态名录


原文标题:高效管理海量数据!忆联 SSD 为分布式块存储提供极致性能

文章出处:【微信公众号:UnionMemory忆联】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    12

    文章

    3856

    浏览量

    84661
  • SSD
    SSD
    +关注

    关注

    20

    文章

    2689

    浏览量

    115493

原文标题:高效管理海量数据!忆联 SSD 为分布式块存储提供极致性能

文章出处:【微信号:UnionMemory忆联,微信公众号:UnionMemory忆联】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    分布式IO工业自动化数据采集与分析的核心

    工业自动化生产的效率。在传统的工业自动化生产中,设备的控制和监测通常采用集中式控制方式,这种方式存在着设备连接复杂、数据传输速度慢、故障率高和扩展性差等问题。而分布式IO采用分布式控制方式,将设备按照
    发表于 12-28 14:47

    鸿蒙原生应用开发——分布式数据对象

    callback 回调函数返回的值,我们可以使用这些返回值判断设备上下线状态,其中 status 参数返回值 online 或者 offline,表示设备对端设备上下线。 5、开启分布式数据对象同步监听
    发表于 12-08 10:01

    分布式系统硬件资源池原理和接入实践

    的使用习惯;手机导航接续到车机后,车机的 GPS 信号可以共享给手机,结合手机 GPS 信号提供更高精度的定位数据;可以看到,在智慧出行场景中,可以通过分布式硬件资源池结合手机和车机的优势硬件,
    发表于 12-06 10:02

    HarmonyOS分布式文件系统开发指导

    各个设备结点提供一个全局一致的访问视图,支持开发者通过基础文件系统接口进行读写访问,具有高性能、低延时等优点。 分布式文件系统架构 ● distributedfile_daemon:主要负责设备上线
    发表于 11-14 17:14

    OpenHarmony 分布式硬件关键技术

    的核心挑战 要实现上述的功能和体验,在跨端分布式硬件技术上存在什么挑战呢?随着超级终端包含的设备越来越多,硬件的管理复杂度也随之攀升。每一个设备的硬件,不仅对本设备提供硬件能力,还要为超级终端中的其他
    发表于 08-24 17:25

    分布式存储的7个特征

    什么是分布式存储呢?如果一个存储系统,不管是对象、块、文件、kv、log、olap、oltp,只要对所管理数据做了Partitioning
    发表于 07-18 14:17 697次阅读

    分布式存储架构面临的挑战

      从云和互联网的业务场景来看,其存储域主要采用基于服务器部署分布式存储服务的融合方式,它面临如下挑战 : 1.数据保存周期与服务器更新周期不匹配。大
    的头像 发表于 07-05 10:44 945次阅读
    <b class='flag-5'>分布式</b><b class='flag-5'>存储</b>架构面临的挑战

    过程语言(2)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 23:00:52

    过程语言(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 23:00:11

    课程介绍(2)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:59:24

    课程介绍(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:58:59

    #分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:58:32

    聚合函数(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:57:57

    窗口函数(2)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:57:17

    嵌套查询(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:49:29