0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高效管理海量数据!忆联 SSD 为分布式块存储提供极致性能

UnionMemory忆联 来源:未知 2023-10-13 15:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近年来,为满足大规模的存储应用需求,分布式存储成为云环境下存储底座构建的重要选择,相较于传统集中式存储方案的可靠性、安全性以及数据利用率较低,分布式存储具有易扩展、高性能、高性价比、支持分级存储、多副本一致性及存储系统标准化等优势。

块存储作为分布式存储的一部分,主要为计算集群虚拟机、容器提供弹性卷服务,而弹性卷 EVS 则是当前云业务平台最核心的存储服务,对存储性能要求极高,基于此,各大云厂商基本采用全闪化形态部署。

Ceph 则是当前业界应用最广泛的开源分布式存储软件,凭借高扩展性、高性能、高可靠等特点,同时支持块存储、文件存储及对象存储接口,已成熟应用于云计算的 IAAS 平台。为更好地助力分布式块存储系统性能及可靠性的提升,忆联在 Ceph 平台下开展实测,本文为此次的测试结论。

一、Ceph 简介

Ceph 是一个统一的分布式存储系统,可提供较好性能、可靠性和扩展性,是面向云计算领域重要的底层存储系统,已在国内运营商、政府、金融、互联网等多个行业落地应用。

wKgZomUt2-WAEOZiAAMho7IhY24568.png

图 1:Ceph 技术架构图

Ceph 主要分为应用接口层、存储基础接口层、存储对象层。接口层主要负责客户端访问,分为本地语言绑定接口、块存储设备接口和文件系统接口,展现了 Ceph 统一性。

在 Ceph 块存储系统中,数据以块的形式存在卷里,块为应用程序提供大存储容量,可靠性和性能都更高,卷可映射到操作系统中,由文件系统层控制。Ceph 块存储系统引入的 RBD(Ceph 块设备)协议为客户端提供了高可靠、高性能、分布式的块存储,同时 RBD 也支持其他的企业级特性,例如完整和增量式快照,精简的配置,写时复制( copy-on-write)式克隆,以及全内存式缓存等,从而大大提高了系统的性能。

wKgZomUt2-WAFuTbAAA6dhTKhGc063.png

图 2:Ceph 块存储组件

二、忆联 Ceph 存储方案验证

1.验证环境

1.1 本次验证硬件配置

wKgZomUt2-WAU48JAAINxIv62uQ637.png

1.2本次验证软件配置

wKgZomUt2-WAAaPRAAE3di4pbGc166.png

1.3本次验证组网规划

wKgZomUt2-WAGSE4AAFnitdjqbs692.png

图 3:Ceph 组网规划架构图

2、验证方法

步骤 1:创建 RBD pool 和 RBD 卷。配置参数 osd_pool_default_size 确定 RBD Pool 池的副本数,2 表示两幅本,3 表示三副本,根据实际副本数需求,将该配置项添加到 ceph.conf 中即可。另外根据规划,需要创建 60 个大小为 100GiB 的 RBD 卷进行 IO 测试。

步骤 2:下发 IO 测试前,需对服务器和客户端的 IO、CPU、网络进行监控,每 2 秒采集一次数据。

步骤 3:在 6 个客户端上同时对 60 个 RBD 卷下发 IO,每个客户端均需绑核,即每个 fio 绑定不同 cpu 核。

步骤 4:完成 IO 测试后,需关闭服务端和客户端的 IO、CPU、网络进行监控。

步骤 5:测试完成后,需汇总所有客户端 fio 的 BW、IOPS、平均时延,汇总对应的监控数据。对于 BW 和 IOPS,累加各 FIO 对应结果即可;对于平均时延,累加之后需求平均值。

3、验证结果

本次在 Ceph 场景下验证结果如下:

①、忆联 UH8 系 SSD 在随机读及顺序读下的表现。

wKgZomUt2-WAcn6mAAFEYTOu4Lo192.png

图 4:Ceph 场景下忆联 UH8 系 SSD 读性能

从图 4 可以看出,在 Ceph 分布式存储系统下,不论是二副本还是三副本,忆联 UH8 系 SSD 的读性能基本持平。在时延方面,二副本与三副本趋势基本一致,1QD 至 32QD 间较为稳定,在 32QD 后时延明显增加。

②、忆联 UH8 系 SSD 在随机写及顺序写下的表现。

wKgZomUt2-WAQL2pAAEqCd2OFCU196.png

图 5:Ceph 场景下忆联 UH8 系 SSD 写性能

如图 5 所示,不论是在随机写还是在顺序写业务下,二副本写性能远高于三副本性能,主要是由于副本复制带来的网络及存储开销,造成三副本写带宽及写 IOPS 下降明显。在总体时延表现上,二副本明显优于三副本。在时延变化趋势上,二副本与三副本基本一致,皆在 32QD 后有比较显著的上升。

③、忆联 UH8 系 SSD 在混合读写场景下的表现。

wKgZomUt2-aAKtOaAAGh4kV_Pzo257.png

图 6:Ceph 场景下忆联 UH8 系 SSD 混合读写性能

从图 6 可以看出,在 4K 7:3 混合读写业务场景下,从 16QD 起,二副本 IOPS 性能优于三副本。在时延整体表现上,二副本低于三副本,但在时延变化趋势上,二副本与三副本基本一致,时延从 32QD 起,明显上升。

小结:从 Ceph 读、写、混合读写业务场景的实测数据中,可以看到忆联 SSD 整体表现优秀,可为 Ceph 环境提供极致存储性能。在时延上,忆联 SSD 在 32QD 及以下场景中,表现亮眼,可获得更佳的时延体验。

④、智能多流降 WA,有效提升 SSD 寿命

为更好解决读写机制带来的写放大而造成的 SSD 性能损耗及使用寿命缩短,忆联推出 SSD 的智能多流特性,通过智能冷热数据分类算法,有效提高 GC(垃圾回收)时的效率,减少写放大,提升 SSD 性能。

wKgZomUt2-aAVMDQAAC9ZURlGYY805.png

图 7:Ceph 场景下智能多流特性测试

在 Ceph 方案中,基于标准 JESD 219 业务模型,针对 SSD 分别开启、关闭智能多流进行写放大测试,通过图 7 对比验证结果可以看到忆联智能多流(IMS)开启后,SSD 写放大降低 20%+,极大提升了 SSD 寿命。

本次验证证明了忆联 SSD 在 Ceph 分布式存储系统中的稳定性能,可有效支撑 Ceph 的存储需求,为 Ceph 提供始终如一的高性能,成为软件定义存储解决方案最优的选择。同时,忆联 SSD 独有的智能多流技术可降低分布式存储场景下 SSD 写放大,提升 SSD 寿命,帮助用户减少总体 TCO。对于 Ceph 分布式存储系统而言,忆联 SSD 是一个可真正做到高性能、高可靠、低成本的存储解决方案。

wKgZomUt2-aAapEdAABbOPPgAIU973.jpg

长按识别关注更多忆联资讯

了解更多:

下一代ZNS?浅谈FDP在企业级SSD应用前景

国庆特辑|忆联SSD通过极端压力中子实验,为数字中国建设提质增速

忆联UH711a获红帽生态系统认证,成功入选红帽生态名录


原文标题:高效管理海量数据!忆联 SSD 为分布式块存储提供极致性能

文章出处:【微信公众号:UnionMemory忆联】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4701

    浏览量

    89582
  • SSD
    SSD
    +关注

    关注

    21

    文章

    3061

    浏览量

    121813

原文标题:高效管理海量数据!忆联 SSD 为分布式块存储提供极致性能

文章出处:【微信号:UnionMemory忆联,微信公众号:UnionMemory忆联】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一键部署无损网络:EasyRoCE助力分布式存储效能革命

    分布式存储性能瓶颈往往在于网络。如何构建一个高带宽、超低时延、零丢包的无损网络,是释放分布式存储全部潜力、赋能企业关键业务(如实时
    的头像 发表于 08-04 11:34 1343次阅读
    一键部署无损网络:EasyRoCE助力<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>效能革命

    安科瑞分布式光伏监控系统:赋能园区企业光伏用电智能化管理

    维成本,成为了园区企业面临的重要挑战。安科瑞分布式光伏监控系统应运而生,园区企业提供了一套全面、智能的光伏用电管理解决方案。(18721098782----安科瑞) 系统架构:分层
    的头像 发表于 07-30 15:57 500次阅读
    安科瑞<b class='flag-5'>分布式</b>光伏监控系统:赋能园区企业光伏用电智能化<b class='flag-5'>管理</b>

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式
    的头像 发表于 07-14 11:15 729次阅读

    英特尔Benchmark验证!UH812a问鼎PCIe Gen5企业级存储性能巅峰

    UH812a PCIe5.0企业级SSD成为首家通过Intel关键组件验证的国产存储产品,其性能全面超越同代竞品。该产品顺序读写达150
    的头像 发表于 07-07 16:33 582次阅读
    英特尔Benchmark验证!<b class='flag-5'>忆</b><b class='flag-5'>联</b>UH812a问鼎PCIe Gen5企业级<b class='flag-5'>存储</b><b class='flag-5'>性能</b>巅峰

    Docker+MySQL 流控方案:打造安全高效存储底座,释放 AI 极致性能

    探讨基于Docker部署的MySQL数据库在AI应用中的关键作用。通过PCIe5.0企业级SSD(UH812a)实测验证,展示了Namespace技术与QoS优化策略如何实现
    的头像 发表于 06-26 13:53 340次阅读
    <b class='flag-5'>忆</b><b class='flag-5'>联</b> Docker+MySQL 流控方案:打造安全<b class='flag-5'>高效</b><b class='flag-5'>存储</b>底座,释放 AI <b class='flag-5'>极致</b><b class='flag-5'>性能</b>

    曙光存储领跑中国分布式存储市场

    近日,赛迪顾问发布《中国分布式存储市场研究报告(2025)》,指出2024 年中国分布式存储市场首次超过集中式存储,规模达 198.2 亿元
    的头像 发表于 05-19 16:50 1012次阅读

    兆芯+图云创智—可信分布式存储系统解决方案

    图云创智分布式存储系统采用全分布式设计与先进的存储虚拟化技术相结合,由多个独立的兆芯 x86 服务器作为存储节点,联合道熵
    的头像 发表于 04-23 10:29 663次阅读
    兆芯+图云创智—可信<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统解决方案

    分布式存储数据恢复—虚拟机上hbase和hive数据数据恢复案例

    分布式存储数据恢复环境: 16台某品牌R730xd服务器节点,每台服务器节点上有数台虚拟机。 虚拟机上部署Hbase和Hive数据库。
    的头像 发表于 04-17 11:05 519次阅读

    PCIe 5.0 SSD支撑大模型全流程训练

    当前,大模型全流程训练对数据存储系统的要求已突破传统边界。企业级SSD作为AI算力基础设施的核心组件,其高可靠性、高性能及智能化管理能力,正
    的头像 发表于 03-11 10:26 907次阅读
    <b class='flag-5'>忆</b><b class='flag-5'>联</b>PCIe 5.0 <b class='flag-5'>SSD</b>支撑大模型全流程训练

    分布式站点设备出现异常故障如何快速定位并进行维护

    一、行业背景 随着数字化、经济化进程的飞速发展,分布式站点在各个行业中的应用愈发广泛。无论是集团企业的分布式工厂,还是城市生命线的供水泵站,亦或是负责存储与处理海量
    的头像 发表于 03-03 11:02 583次阅读
    <b class='flag-5'>分布式</b>站点设备出现异常故障如何快速定位并进行维护

    分布式存储有哪几种类型?

    分布式存储有哪几种类型?分布式存储系统是一种将数据分散存储在多台独立节点上的技术,根据
    的头像 发表于 02-20 11:00 1131次阅读

    天工平台:加速SSD产品验证,释放超凡产能

    SSD产品由概念设计至市场投放的复杂旅程中,产品测试验证环节扮演着至关重要的角色。它不仅是确保产品质量的坚实壁垒,更是推动SSD性能不断攀升的核心动力。 作为固态存储解决方案领域的佼
    的头像 发表于 02-07 11:26 859次阅读

    分布式云化数据库有哪些类型

    分布式云化数据库有哪些类型?分布式云化数据库主要类型包括:关系型分布式数据库、非关系型分布式数据
    的头像 发表于 01-15 09:43 883次阅读

    HarmonyOS Next 应用元服务开发-分布式数据对象迁移数据文件资产迁移

    提供了async版本供该场景使用。 当前,wantParams中“sessionId”字段在迁移流程中被系统占用,建议开发者在wantParams中定义其他key值存储分布式数据对象
    发表于 12-24 10:11

    HarmonyOS Next 应用元服务开发-分布式数据对象迁移数据权限与基础数据

    提供了async版本供该场景使用。 当前,wantParams中“sessionId”字段在迁移流程中被系统占用,建议开发者在wantParams中定义其他key值存储分布式数据对象
    发表于 12-24 09:40