0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

服务器数据恢复-EVA存储硬盘掉线的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2023-08-22 15:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

EVA系列存储是一款以虚拟化存储为实现目的的中高端存储设备。EVA存储中的数据在EVA存储设备工作过程中会不断进行迁移,如果运行的任务比较复杂,EVA存储磁盘负载加重,很容易出现故障的。EVA存储通过大量磁盘的冗余空间和故障后rss冗余磁盘动态迁移来保护存储中的数据安全,但如果掉线磁盘越来越多,这种保护数据安全的能力会超过阈值,直至存储崩溃。下面分享一个EVA存储的数据恢复案例。

EVA存储故障&检测:

硬件架构:EVA某型号控制器+EVA扩展柜+若干FC磁盘。磁盘故障导致EVA存储中的LUN不可用,上层应用无法正常使用。

北亚企安数据恢复工程师拿到故障存储后,将所有磁盘编号后取出,对所有磁盘做物理故障检测,经过检测发现所有磁盘不存在物理故障,也没有在磁盘中发现大量的坏道。

将所有磁盘以只读方式做全盘镜像备份,镜像完成后按照编号将所有磁盘还原到原存储设备中,后续的数据分析和数据恢复操作在镜像文件上进行,避免对原始磁盘数据造成二次破坏。

EVA存储故障分析:

磁盘没有发现物理故障或者大量坏道,服务器数据恢复工程师初步判断故障的原因是某些磁盘读写不稳定。EVA控制器针对磁盘的检测策略非常严格,EVA控制器通常情况下会认定性能不稳定商务磁盘为坏盘并踢出磁盘组。一旦某个LUN的同一个条带中掉线的盘到达极限,这个LUN将不可用。也就是说如果EVA中所有的LUN都包含这些掉线的盘,这些LUN都会受影响。所以部分磁盘故障掉线也可能会导致存储无法正常使用。

EVA存储中的LUN是以RAID条目的形式来存储数据的。EVA存储将每个磁盘的不同块组成一个RAID条目,RAID条目有数种类型。如果要恢复数据就需要分析出组成LUN的RAID条目类型以及RAID条目是由哪些盘的哪些块组成的。这些信息都存放在LUN_MAP中,每个LUN都有一份LUN_MAP。EVA将LUN_MAP分别存放在不同的磁盘中并使用一个索引来指定其位置。因此在磁盘中找到这个指向LUN_MAP的索引就可以找到现存LUN的信息了。

因为EVA存储中掉线的磁盘存在陈旧的数据,在恢复数据的时候需要将这些磁盘都排除掉。由于LUN中的阵列是RAID5,将一个LUN的RAID条目通过RAID5的校验算法算出校验值,再和原有的校验值作比较就可以判断这个条目中是否有掉线盘。而将一个LUN的所有LUN_MAP都校验一遍就可以知道这个LUN中哪些RAID条目中有掉线硬盘。这些RAID条目中都存在的那个盘就一定是掉线盘。排除掉线盘后通过LUN_MAP恢复出所有LUN数据即可。

EVA存储数据恢复过程:

1、北亚企安数据恢复工程师编写扫描LUN_MAP的程序扫描全部LUN_MAP,然后通过人工分析确定LUN_MAP。

2、编写检测RAID条目的程序检测所有LUN中掉线的磁盘,然后通过人工分析排除掉线的磁盘。

3、编写LUN数据恢复程序,结合LUN_MAP恢复所有LUN数据。人工核对每个LUN,确认是否和用户方描述的一致。

部分LUN的数据:

wKgaomTkYlCABwsAAAEy15pl6lQ807.png

北亚企安数据恢复——EVA存储数据恢复

4、分析恢复出来的LUN,重组&解析ASM磁盘组。

分析每个LUN前端的结构数据,根据ASM磁盘头结构来区分哪些LUN是属于ASM磁盘组的。通过分析共发现有2套ASM磁盘组。每个ASM磁盘组包含的LUN中的分区情况如下:

wKgaomTkYmWAY0jbAAOnxrnY-9s336.png

北亚企安数据恢复——EVA存储数据恢复

wKgaomTkYmyAFn0AAAHNDiTX3yg133.png

北亚企安数据恢复——EVA存储数据恢复

使用ASM结构解析工具解析和修复ASM磁盘组,解析出此ASM中存储的所有数据库文件。

wKgZomTkYnOAHO0sAAIQA3Bw9uM040.png

北亚企安数据恢复——EVA存储数据恢复

将解析出来的数据库文件按照文件类型分组导出并对导出数据进行检测。

wKgZomTkYnqAaMlBAAHxblDJ9pQ452.png

北亚企安数据恢复——EVA存储数据恢复

使用ASM解析工具恢复出所有的数据库文件。

5、根据用户方的描述,所有LUN的数据分成两大部分:Vmware的虚拟机和ORACLE上的ASM磁盘组数据。ASM磁盘组中存放的是Oracle的dbf数据库文件。由于通过恢复出来的LUN无法直接看到里面的文件,人工核对哪些LUN存放Vmware的数据,哪些LUN存放ASM设备,然后将LUN挂载到不同的验证环境中验证恢复的数据的完整性(验证过程就不赘述了)。

6、验证没有问题后,将vmware虚拟机文件和Oracle数据库文件移交给用户方。用户方将移交的数据上传至后台,程序可正常运行,没有发现问题,用户认可恢复结果。运行情况如下。

wKgaomTkYoaAKhyRAAVMm6uZ8C8333.png

北亚企安数据恢复——EVA存储数据恢复

wKgZomTkYoaAUT_DAAKrVUEPToA645.png

北亚企安数据恢复——EVA存储数据恢复

wKgaomTkYpCAEEgZAAZ-Dxrhpq0048.png

北亚企安数据恢复——EVA存储数据恢复

运行规定:

wKgaomTkYpqAQ8QaAAY0Oq6aF0w301.png

北亚企安数据恢复——EVA存储数据恢复

wKgaomTkYpqAHz2rAAO2o9IIIDg911.png

北亚企安数据恢复——EVA存储数据恢复

运行变更摘要:

wKgZomTkYqKAVqkZAALlpeSCjHw414.png

北亚企安数据恢复——EVA存储数据恢复

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 硬盘
    +关注

    关注

    3

    文章

    1355

    浏览量

    59570
  • 存储
    +关注

    关注

    13

    文章

    4693

    浏览量

    89568
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90879
  • 数据恢复
    +关注

    关注

    10

    文章

    688

    浏览量

    18799
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    服务器数据恢复硬盘离线致raid5阵列崩溃,数据恢复大揭秘

    公司的一台服务器中有一组数块硬盘组建的raid5阵列。 服务器中有一块硬盘由于未知原因离线,服务器崩溃,
    的头像 发表于 11-04 15:32 163次阅读

    服务器数据恢复—EqualLogic存储上raid5磁盘阵列数据恢复案例

    服务器存储数据恢复环境&故障: 某品牌EqualLogic PS6100存储阵列上有一组由16块硬盘
    的头像 发表于 10-21 15:04 163次阅读

    服务器数据恢复硬盘指示灯亮黄灯,RAID5崩溃数据这样恢复

    服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块的硬盘
    的头像 发表于 10-14 17:17 395次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>硬盘</b>指示灯亮黄灯,RAID5崩溃<b class='flag-5'>数据</b>这样<b class='flag-5'>恢复</b>

    服务器数据恢复—RAIDZ多块硬盘离线导致服务器崩溃的数据恢复案例

    服务器数据恢复环境&故障: 一台服务器有32块硬盘,采用Windows操作系统。 服务器在正
    的头像 发表于 09-18 12:29 510次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—RAIDZ多块<b class='flag-5'>硬盘</b>离线导致<b class='flag-5'>服务器</b>崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—Raid6阵列数据恢复案例

    服务器存储数据恢复环境: 一台infortrend某型号存储存储设备上有12块
    的头像 发表于 09-09 11:07 419次阅读

    服务器数据恢复服务器断电导致raid模块损坏的数据恢复案例

    某品牌服务器中有12块硬盘,组建了一组raid5磁盘阵列,服务器存储的是普通文件。 机房供电不稳定导致服务器断电,管理员重启
    的头像 发表于 09-04 12:57 455次阅读

    服务器数据恢复—坏道“突袭”Raid5阵列,数据恢复大揭秘

    北京市某单位的办公用服务器服务器上有一组由6块硬盘组建的raid5磁盘阵列。 服务器崩溃,经过初步检测,发现raid5阵列的两块硬盘
    的头像 发表于 08-05 11:24 547次阅读

    服务器数据恢复硬盘离线导致raid上层的卷无法挂载的数据恢复案例

    服务器数据恢复环境&故障: 某公司一台服务器上有一组由24块FC硬盘组建的raid。 服务器
    的头像 发表于 07-29 13:00 439次阅读

    服务器数据恢复—raid5阵列多块硬盘离线导致EMC存储不可用的数据恢复案例

    服务器存储数据恢复环境: EMC某型号存储中有一组由8块硬盘组建的raid5磁盘阵列。
    的头像 发表于 05-29 10:50 397次阅读

    服务器数据恢复—Linux系统服务器崩溃的数据恢复案例

    服务器数据恢复环境: linux操作系统服务器中有一组由4块SAS接口硬盘组建的raid5阵列。
    的头像 发表于 05-20 15:46 549次阅读

    服务器数据恢复—raid5阵列中硬盘坏道导致阵列崩溃的数据恢复案例

    服务器存储数据恢复环境: 某品牌DS3512存储中有一组由6块SAS磁盘组建的raid5阵列。划分一个lun分配给Linux系统
    的头像 发表于 03-28 13:25 584次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—raid5阵列中<b class='flag-5'>硬盘</b>坏道导致阵列崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—Raid5阵列热备盘上线失败的数据恢复案例

    服务器数据恢复环境: 某公司一台存储上有一组由15块硬盘组建的raid5阵列。raid5阵列上层是一个xfs裸分区,起始位置是0扇区。
    的头像 发表于 03-26 15:17 519次阅读

    服务器数据恢复—Zfs文件系统服务器数据恢复案例

    服务器数据恢复环境&故障: 一台zfs文件系统的服务器,管理员误操作删除了服务器上的数据
    的头像 发表于 01-16 17:27 631次阅读

    服务器数据恢复服务器硬盘灯闪黄灯的数据恢复案例

    ,而其他颜色的灯没有亮的话,通常表示这块硬盘出现故障,这时候更换新硬盘同步数据即可。 如果没有及时发现硬盘损坏或者更换硬盘失败导致
    的头像 发表于 01-03 13:23 1011次阅读

    服务器数据恢复—ZFS文件系统下RAIDZ数据恢复案例

    服务器存储数据恢复环境: ZFS Storage 7320存储阵列中有32块硬盘。32块
    的头像 发表于 12-19 13:31 1024次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—ZFS文件系统下RAIDZ<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例