0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

EVA存储多块硬盘离线的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2023-04-14 12:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

服务器数据恢复环境:

HP-EVA存储环境:EVA某型号控制器+EVA扩展柜+FC硬盘。

服务器故障:

EVA存储中两块磁盘掉线导致存储中某些LUN丢失不可用。

服务器数据恢复过程:

1、首先对故障存储中所有磁盘做物理故障检测,经过检测没有发现有硬盘存在物理故障。使用坏道检测工具检测也没有发现坏道,磁盘坏道检测日志部分截图:

pYYBAGQ4z7yAKx95AAHQwWZpo1s129.png

北亚企安数据恢复——EVA存储数据恢复

2、将故障存储中所有磁盘以只读方式做完整镜像备份,以防后续数据恢复过程中操作不当对原始数据造成二次破坏。部分备份数据如下:

pYYBAGQ4z9eAcWTDAAEMV5itO04047.png

北亚企安数据恢复——EVA存储数据恢复

3、由于所有磁盘没有发现物理故障或者坏道,可以判断硬盘掉线是因为磁盘读写不稳定导致的。EVA控制器对磁盘的检测策略非常严格,EVA控制器会认为性能不稳定的磁盘是坏盘,将认为是坏盘的磁盘踢出磁盘组。如果某个LUN的同一个条带中掉线的磁盘到达极限,这个LUN将不可用,即如果EVA存储中所有的LUN都包含这些掉线的盘,所有LUN都会受影响,所以两块磁盘掉线也会导致整个存储的LUN都不可用。目前的情况是现存8个LUN,损坏7个LUN,丢失6个LUN,需要恢复存储中所有LUN的数据。

4、HP-EVA的LUN都是以RAID条目的形式来存储数据的,EVA将每个磁盘的不同块组成一个RAID条目,RAID条目的类型可以有很多种。需要分析出组成LUN的RAID条目类型和这个RAID条目是由哪些盘的哪些块组成。这些信息都存放在LUN_MAP中,每个LUN都有一份LUN_MAP。EVA将LUN_MAP分别存放在不同的磁盘中,使用一个索引来指定其位置。因此去每个磁盘中找到这个指向LUN_MAP的索引就可以找到现存LUN的信息。

5、虽然磁盘中记录了指向LUN_MAP的索引,但是它只记录现存的LUN,丢失的LUN是不会被记录索引的。由于EVA中删除一个LUN只会清除这个LUN的索引,并不会清除这个LUN的LUN_MAP。所以只需要扫描所有磁盘,找到所有符合LUN_MAP的数据块,排除现有的LUN_MAP,剩下的LUN_MAP也不一定全是删除的,也有一些可能是旧的。这种情况下是无法在LUN_MAP中筛选的,只能先将所有LUN_MAP的数据都恢复出来,人工去核对哪些LUN是删除的。

6、掉线磁盘中存放的是一些旧的数据,在生成数据的时候需要将这些磁盘都排除掉,提取数据之前需要把这些掉线磁盘找到。由于LUN的RAID结构大多都是RAID5,只需要将一个LUN的RAID条目通过RAID5的校验算法算出校验值,再和原有的校验值做比较就可以判断这个条目中是否有掉线盘。将一个LUN的所有LUN_MAP都校验一遍就可以知道这个LUN中的哪些RAID条目中有掉线盘,这些RAID条目中都存在的那个盘就一定是掉线盘。排除掉掉线盘并根据LUN_MAP恢复所有LUN的数据即可。

7、北亚企安数据恢复工程师编写扫描LUN_MAP的程序扫描全部LUN_MAP,结合人工分析获取到最精确的LUN_MAP。编写检测RAID条目的程序检测所有LUN中掉线的磁盘,结合人工分析排除掉掉线的磁盘。编写LUN数据恢复程序结合LUN_MAP恢复所有LUN数据。

8、人工核对恢复出来的每个LUN,确认是否和用户方工程师描述的一致。部分LUN如下:

pYYBAGQ4z96AaouiAAEI0gfaVlo547.png

北亚企安数据恢复——EVA存储数据恢复

数据验证:

用户方工程师对恢复出来的数据进行检验,经过反复验证后确认数据完整可用,本次数据恢复工作完成。

EVA存储数据安全Tip:

1、经常巡视机房设备,发现报警信息及时处理。

2、操作存储时要谨慎,避免误操作导致数据丢失。

3、如果发现EVA控制器部分模块不稳定,应及时更换。

4、由于EVA存储故障多是由磁盘不稳定导致的,EVA存储内的磁盘应该是同一批次的磁盘。因此,没有掉线的磁盘性能也快到极限,如有条件建议一起更换这批磁盘。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 控制器
    +关注

    关注

    114

    文章

    17638

    浏览量

    190247
  • 硬盘
    +关注

    关注

    3

    文章

    1355

    浏览量

    59572
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90880
  • 数据恢复
    +关注

    关注

    10

    文章

    688

    浏览量

    18802
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    服务器数据恢复硬盘离线致raid5阵列崩溃,数据恢复大揭秘

    公司的一台服务器中有一组数硬盘组建的raid5阵列。 服务器中有一硬盘由于未知原因离线,服务器崩溃,
    的头像 发表于 11-04 15:32 167次阅读

    服务器数据恢复—EqualLogic存储上raid5磁盘阵列数据恢复案例

    服务器存储数据恢复环境&故障: 某品牌EqualLogic PS6100存储阵列上有一组由16硬盘
    的头像 发表于 10-21 15:04 163次阅读

    服务器数据恢复硬盘指示灯亮黄灯,RAID5崩溃数据这样恢复

    服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50硬盘
    的头像 发表于 10-14 17:17 396次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>硬盘</b>指示灯亮黄灯,RAID5崩溃<b class='flag-5'>数据</b>这样<b class='flag-5'>恢复</b>

    服务器数据恢复—RAIDZ硬盘离线导致服务器崩溃的数据恢复案例

    服务器数据恢复环境&故障: 一台服务器有32硬盘,采用Windows操作系统。 服务器在正常运行的时候突然变得不可用。没有异常断电、进水、异常操作、机房不稳定等外部因素。服务器管
    的头像 发表于 09-18 12:29 510次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—RAIDZ<b class='flag-5'>多</b><b class='flag-5'>块</b><b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>导致服务器崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—Raid6阵列数据恢复案例

    服务器存储数据恢复环境: 一台infortrend某型号存储存储设备上有12
    的头像 发表于 09-09 11:07 419次阅读

    服务器数据恢复—StorNext文件系统数据丢失的数据恢复案例

    服务器存储数据恢复环境&故障: 一台昆腾存储设备中有一组raid5磁盘阵列。阵列上有两硬盘
    的头像 发表于 08-19 11:43 389次阅读

    存储数据恢复—EqualLogic存储硬盘指示灯亮黄色导致存储不可用的数据恢复

    一台EqualLogic存储上有一组由16SAS硬盘组成的RAID5阵列。上层部署VMFS,存放的数据是虚拟机文件。存储系统上层划分4个卷
    的头像 发表于 07-31 13:16 390次阅读
    <b class='flag-5'>存储</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—EqualLogic<b class='flag-5'>存储</b><b class='flag-5'>硬盘</b>指示灯亮黄色导致<b class='flag-5'>存储</b>不可用的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>

    服务器数据恢复硬盘离线导致raid上层的卷无法挂载的数据恢复案例

    服务器数据恢复环境&故障: 某公司一台服务器上有一组由24FC硬盘组建的raid。 服务器出现故障,无法正常工作。 经过初步检测,管理员发现导致服务器故障的原因是raid中有两
    的头像 发表于 07-29 13:00 439次阅读

    服务器数据恢复—raid5阵列硬盘离线导致raid崩溃的数据恢复

    阵列中一离线,但热备盘未自动激活rebuild。直到另外一离线,RAID崩溃。 由于oracle已经不再对本案例中的oa系统提供后续支持,用户方要求尽可能
    的头像 发表于 07-17 14:37 418次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—raid5阵列<b class='flag-5'>多</b><b class='flag-5'>块</b><b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>导致raid崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>

    服务器数据恢复—raid5阵列硬盘离线导致EMC存储不可用的数据恢复案例

    服务器存储数据恢复环境: EMC某型号存储中有一组由8硬盘组建的raid5磁盘阵列。
    的头像 发表于 05-29 10:50 397次阅读

    服务器数据恢复—NAS存储硬盘出现故障的数据恢复案例

    NAS数据恢复环境: QNAP TS-532X NAS设备中有两1T的SSD固态硬盘和35T的机械
    的头像 发表于 04-24 14:38 605次阅读

    服务器数据恢复—raid5阵列中硬盘坏道导致阵列崩溃的数据恢复案例

    文件。 存储中的数据包括:数十台iunx系统虚拟机和windows系统虚拟机、压缩包文件、配置文件。 服务器存储故障: raid5阵列中
    的头像 发表于 03-28 13:25 584次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—raid5阵列中<b class='flag-5'>硬盘</b>坏道导致阵列崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—nas中硬盘离线导致raid6阵列崩溃的数据恢复案例

    一台nas上共有14硬盘组建了一组raid6磁盘阵列。 该nas在工作过程中,raid6阵列中硬盘出现故障离线,导致raid6阵列失效,nas无法正常访问。
    的头像 发表于 01-07 13:13 844次阅读

    服务器数据恢复—OceanStor存储RAID5阵列数据恢复案例

    华为OceanStor T系列某型号存储中有一组由24机械硬盘组建的一组RAID5阵列。 运行过程中该存储设备RAID5阵列上
    的头像 发表于 12-31 13:49 712次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—OceanStor<b class='flag-5'>存储</b>RAID5阵列<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—RAID5阵列两硬盘离线崩溃,数据如何起死回生?

    服务器数据恢复环境: 两组分别由4SAS接口硬盘组建的raid5阵列,两组raid5阵列划分LUN并由LVM管理,格式化为EXT3文件系统。 服务器故障: RAID5阵列中
    的头像 发表于 12-11 13:17 1856次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—RAID5阵列两<b class='flag-5'>块</b><b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>崩溃,<b class='flag-5'>数据</b>如何起死回生?