0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SDS抗造的常见方法介绍

西西 来源:feiyan 2018-12-02 11:09 次阅读

1 软件定义“抗造”

我们知道软件定义存储SDS有很多优势,比如:

硬件分离,无硬件厂商锁定。

高扩展性,在线按需扩容,无需中断业务。

标准控制API接口,秒级操作,无缝对接其他系统。

标准数据访问接口,支持块、文件、对象存储等。

性能和容量可配置,满足当前和未来场景的需求。

除此之外,SDS还可以灵活定义可靠性、可用性,因此SDS特别抗造。

我们先了解可靠性和可用性的含义,再对故障进行分类,最后对比各种抗造技术,方便大家在做SDS选型和架构设计时进行“软件定义”。

2可靠性与可用性

可靠性(durability):表示数据是否丢失。比如硬盘发生介质故障,导致硬盘里面的数据丢失。

SDS抗造的常见方法介绍

可用性(availability):表示数据是否可以访问。比如因为服务器掉电原因,导致暂时不能访问服务器硬盘中的数据。

3故障分类

总体分类为:硬件、软件、天灾、人祸。具体分类如下表所示。

SDS抗造的常见方法介绍

其中硬盘发生故障非常频繁,下面云备份服务商blackblaze的硬盘年平均故障率统计,一共统计了82516块硬盘在2013年~2017年间的故障率。

在实际经验中,我们也会经常碰到服务器、机柜、交换机、站点的故障。那么多故障,我们需要不同的技术来应对,下面我们来看不同技术的优缺点。

4抗造技术

4.1 单机RAID

一般服务器上都会自带RAID卡,支持RAID1、10、5、6等。RAID技术通过数据冗余保证在1~N块硬盘故障时,数据不丢失,并且同时可以访问到数据。

比如RAID5支持同时坏1块硬盘,RAID6支持同时坏2块硬盘。

SDS抗造的常见方法介绍

但是RAID的缺点是:

●仅支持单机。假如服务器宕机,RAID技术也无力回天。

●数据恢复速度慢,受限于单个硬盘的写速度,导致RAID组要恢复健康状态需要10个小时以上,特别在越来越大的硬盘容量的情况下。在数据恢复过程中,容易发生二次故障,导致数据丢失。

● RAID组所包含的硬盘数量太少,不能并行发挥所有硬盘的性能。

●需要单独的Spare热备盘,平时会造成资源浪费。

4.2 多机网络多副本

因为单机RAID的缺点,随着万兆以太网的普及,多机网络多副本技术随之产生,广泛被各种分布式存储软件使用。

SDS抗造的常见方法介绍

多机网络多副本的优点是恢复速度快,并行发挥所有硬盘的性能,另外当单台服务器宕机了,不影响数据的可用性和可靠性,其他服务器继续提供服务。缺点是存储容量利用率低,可用容量和裸容量比例是1:3。

4.3 多机网络EC纠删码

为了解决多副本的存储容量利用率低的问题,大家开发了网络EC纠删码,也被广泛应用在分布式存储上,比如HDFS的EC纠删码。

SDS抗造的常见方法介绍

它优点是可用容量和裸容量比例是1:1.3~1.5,大文件写吞吐量高,缺点是写操作延迟高。

4.4 机架柜列故障域隔离

SDS还可以定义数据分布策略,这样可以防止机架柜列掉电造成的影响。

SDS抗造的常见方法介绍

假如多副本分布在不同的机架上,则任一机架掉电,不影响数据可靠性和可用性。

假如多副本分布在不同的柜列上,则任一柜列掉电,不影响数据可靠性和可用性。

4.5 网络冗余

SDS通过网口链路聚合和交换机堆叠技术,提供网络冗余度,避免单个网口和交换机的故障造成数据不可访问的影响,提高数据可用性。

SDS抗造的常见方法介绍

4.6 多站点多副本

为了满足存储系统两地三中心、多站点多活的需求,目前部分SDS产品的对象存储服务支持多站点多副本技术,数据三个副本同时存储在三个站点上,可以多站点同时访问,支持多活技术。当任意一个站点发生故障时,不影响其他站点的数据访问和写入。

SDS抗造的常见方法介绍

4.7 多站点EC纠删码

多站点EC纠删码技术可以提高存储容量利用率,支持在1个站点故障的情况下,数据能够正常访问和读写,适用于冷数据和归档场景。

SDS抗造的常见方法介绍

4.8 Cloud Sync(云备份)

不是所有场景都有条件建设多站点,因此SDS的Cloud Sync(云备份)功能应运而生,可以把数据异步复制到公有云和异地私有云上,避免额外建设,降低成本。当本地存储集群发生故障时,数据可以快速恢复和访问。

SDS抗造的常见方法介绍

具体应用场景如下所示:

4.9 智能故障自愈

SDS可以采用先进的数据分布算法,在出现硬盘故障和服务器故障时可以进行数据迁移和重平衡,故障硬盘会被踢出存储集群,不再工作。数据迁移完成后,SDS存储集群恢复正常,无须人工干预。因当出现硬盘故障时,可以不用处理,后期再批量更换硬盘,减少运维成本。

4.10 对象存储超时删除

对于特定场景,数据保存一定周期之后需要删除,以便释放空间,SDS的对象存储服务具有超时删除功能。下图是10天后删除数据的设置。

SDS抗造的常见方法介绍

4.11 监控告警平台

通过监控告警平台,可以把不同级别的告警信息通过邮件和短信发送给管理员,让管理员快速知晓存储集群的健康状态,并采取适当的行动。

5 技术对比

下表对比了不同技术的抗造指标,我们要根据实际场景进行选择和组合,权衡数据可靠性和成本。

SDS抗造的常见方法介绍

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    8116

    浏览量

    82505
  • SDS
    SDS
    +关注

    关注

    0

    文章

    45

    浏览量

    15125
  • 软件定义
    +关注

    关注

    0

    文章

    76

    浏览量

    13601
收藏 人收藏

    评论

    相关推荐

    PCBA测试的常见方法

    以看出整个工艺流程存在的问题,比如前期工序SMT、DIP等,存在问题,就进行调整,让整个工艺更加完善。PCBA测试常见方法,主要有以下几种: 1.手工测试手工测试就是直接依靠视觉进行测试,通过视觉与比较来
    发表于 11-08 17:19

    汽车电子MCU中采用EMI的设计方法介绍

    集成电路电磁干扰与扰度的设计和测试方法,而且有必要与集成电路的应用相结合。针对汽车电子领域来讲,将对整车级、零部件级的电磁兼容要求强制性标准,结合到集成电路的设计中,才能使电路更易于设计出符合标准
    发表于 07-25 06:13

    IDC设备资产运营中四种“折旧率计算”的常见方法

    原标题:IDC设备资产运营中四种“折旧率计算”的常见方法数据中心基础设施设备管理中设备的折旧是固定资产的折旧。该基础设施设备或者IT设备在长期使用后仍可保持其原始物理形态,但由于芯片、电机、磁盘
    发表于 09-01 06:06

    介绍常见的CPU故障及维护方法

    我们使用电脑的时候有一个CPU的硬件,大家很多对这个硬件不是很了解,遇到状况也很难解决,下面给大家介绍常见的CPU故障及维护方法,欢迎阅读!常见的CPU故障及维护
    发表于 09-08 06:09

    光耦隔离的4种常见方法对比

    光耦隔离的4种常见方法对比
    发表于 05-31 11:06 13.1w次阅读
    光耦隔离的4种<b class='flag-5'>常见方法</b>对比

    检测LED单元板的常见方法

    LED电子显示屏很重要的组成部分就有LED单元板,如果单元板有问题,会直接影响LED显示屏的整体质量!所以,如何辨别LED单元板的好坏是LED显示屏商家关心的问题,下面整理了一些检测LED单元板的常见方法
    发表于 05-04 17:31 3265次阅读

    电平转换常见方法的汇总比较资料下载

    电子发烧友网为你提供电平转换常见方法的汇总比较资料下载的电子资料下载,更有其他相关的电路图、源代码、课件教程、中文资料、英文资料、参考设计、用户指南、解决方案等资料,希望可以帮助到广大的电子工程师们。
    发表于 04-09 08:44 9次下载
    电平转换<b class='flag-5'>常见方法</b>的汇总比较资料下载

    PCBA工厂确保采购物料原装的常见方法

    PCBA工厂确保采购物料原装的常见方法是先核验供应商的资质,然后让供应商提供欲采购物料的原厂授权证明。在收到物料后让仓管仔细检查核对,避免收到氧化料、老料、型号参数不对的物料。
    的头像 发表于 08-20 12:09 858次阅读

    箱式变压器保养的常见方法和事项

      箱式变压器是工业、矿山、建筑等各个领域中常见的基础设施,作为电力系统中不可缺少的设备之一,需要定期进行保养与维护,以确保其正常、安全、稳定地运行。以下是箱式变压器保养的常见方法
    发表于 04-19 14:45 1729次阅读

    RS-485基础知识:处理空闲总线条件的两种常见方法

    在本文中,我将介绍处理空闲总线条件的两种常见方法,以便保证总线上的逻辑状态。
    的头像 发表于 07-04 11:30 1648次阅读
    RS-485基础知识:处理空闲总线条件的两种<b class='flag-5'>常见方法</b>

    MCU批量生产下载程序的几种常见方法

    MCU批量生产下载程序的几种常见方法
    的头像 发表于 10-24 17:22 999次阅读
    MCU批量生产下载程序的几种<b class='flag-5'>常见方法</b>

    运行Python程序的几种常见方法

    Python是一种高级编程语言,具有简单易学,易于阅读和调试的特点。当你完成了一个Python程序之后,你需要运行它以检查程序是否按照预期工作。下面是运行Python程序的几种常见方法
    的头像 发表于 11-28 15:32 470次阅读

    Linux系统中调用脚本的常见方法

    在linux系统中有多种方法可以在系统启动后调用脚本,接下来介绍几种常见方法
    的头像 发表于 12-13 18:16 507次阅读

    无功补偿的原理、作用及常见方

    无功补偿的原理、作用及常见方式  无功补偿是电力系统中的一项重要技术措施,用于改善电力质量和提高能源利用效率。本文将详细介绍无功补偿的原理、作用以及常见的补偿方式。 一、无功补偿的原理 无功功率
    的头像 发表于 01-19 14:19 979次阅读

    设计制作PCB覆铜板的五种种常见方法

    一站式PCBA智造厂家今天为大家讲讲pcb设计覆铜设计方法有哪些?PCB设计覆铜设计方法和原则。PCB板是电子工业中最为常见的基础性元器件之一,其覆铜层的设计对PCB的性能有着至关重要
    的头像 发表于 04-09 10:04 169次阅读
    设计制作PCB覆铜板的五种种<b class='flag-5'>常见方法</b>