0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

服务器数据恢复—存储中raid5阵列多块磁盘离线导致lun不可用的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2024-04-29 11:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

服务器存储数据恢复环境:
某品牌MSA2000存储,该存储中有一组由8块SAS硬盘(其中有一块热备盘)组建的RAID5阵列,raid5阵列上层划分了6个lun,均分配给HP-Unix小型机使用,主要数据为oracle数据库和OA服务端。

服务器存储故障:
该MSA2000存储RAID5阵列中2块硬盘出现故障离线,阵列中只有一块热备盘,虽然热备盘成功激活,RAID5阵列瘫痪,上层LUN无法使用,存储不可用。

服务器存储数据恢复过程:
1、收到故障存储中所有磁盘后,由硬件工程师对所有磁盘做物理故障检测,没有发现有硬盘存在明显物理故障,都可以正常读取。使用坏道检测工具检测所有磁盘,也没有发现有硬盘存在坏道。
2、将所有磁盘以只读方式做扇区级全盘镜像。镜像完成后将所有磁盘还给用户方,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。

wKgZomYvE8uAAzFWAAFLRTt8vUw451.png

北亚企安数据恢复——LVM数据恢复



注:由于所有磁盘没有检测出存在明显的物理故障或者坏道,所以可以判断出磁盘离线的原因是读写性能不稳定。因为MSA2000存储中的raid控制器的磁盘检查策略非常严格,一旦阵列中有磁盘性能不稳定,控制器就将这些磁盘识别为坏盘并踢出RAID。一旦RAID中掉线的盘到超过该RAID级别所允许掉盘的最大数量,该RAID崩溃,上层基于RAID的LUN也将不可用。
3、MSA2000存储的LUN都是基于RAID的。分析所有磁盘中数据,发现其中一块盘的数据同其它盘不一样,可以初步判断这块盘是热备盘盘。分析每一块硬盘中的数据,发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一样,初步判断此硬盘是先掉线的那块磁盘。通过RAID校验程序对这个条带做校验,最终确定先掉线的那块硬盘。分析Oracle数据库页在每个磁盘中的分布情况,并根据数据分布的情况获取RAID的条带大小,磁盘顺序及数据走向等RAID的重要信息。根据分析出的RAID信息虚拟重组原始RAID。
4、分析LUN在RAID中的分配情况,以及LUN分配的数据块MAP。将每一个LUN的数据块分布MAP提取出来,北亚企安数据恢复工程师编写程序解析所有LUN的数据MAP,然后根据数据MAP导出所有LUN的数据。

wKgaomYvE96AZIG_AAGwvCsqmmo184.png

北亚企安数据恢复——LVM数据恢复



5、分析所有导出的LUN,发现所有LUN中均包含HP-Unix的LVM信息。尝试解析每个LUN中的LVM信息,一共发现三个LVM:一个LVM中划分了一个LV,里面存放OA服务器端的数据;一个LVM中划分了一个LV,里面存放临时备份数据;剩余4个LUN组成一个LVM,只划分了一个LV,里面存放Oracle数据库文件。北亚企安数据恢复工程师编写LVM解释程序,尝试将所有LVM中的LV都解释出来,但发现解释过程中程序出错。
6、分析程序报错原因,开发工程师debug程序出错的位置。文件系统工程师对恢复出来的LUN做检测后发现存储瘫痪导致LVM信息损坏。尝试人工修复损坏的区域并同步修改程序,重新解析LVM逻辑卷。
7、搭建HP-Unix环境,将解释出来的LV映射到HP-Unix并尝试Mount文件系统,结果Mount文件系统出错。尝试使用“fsck –F vxfs” 命令修复vxfs文件系统,修复完成后仍然无法挂载文件系统。怀疑vxfs文件系统的部分元数据可能被破坏,需要手工修复。
8、仔细分析解析出来的LV,根据VXFS文件系统的底层结构校验此文件系统是否完整。经过分析发现VXFS文件系统果然存在问题,原来存储瘫痪的时候VXFS文件系统正在执行IO操作,导致部分文件系统元文件损坏。手工修复损坏的元文件,直到能够正常解析VXFS文件系统。再次将修复好的LV挂载到HP-Unix小型机上,尝试Mount文件系统,这回没有报错,成功挂载。
9、在HP-Unix小型机上mount文件系统后,将所有用户数据备份至指定磁盘空间。
部分文件目录截图:

pYYBAGRI4-eAFRl1AADZ-lwf5uc521.png

北亚企安数据恢复——LVM数据恢复



10、使用Oracle数据库文件检测工具“dbv”检测每个数据库文件的完整性,经过检测没有发现问题。再使用北亚企安自主研发的Oracle数据库检测工具进行检测,发现部分数据库文件和日志文件校验不一致。由数据库工程师对此类文件进行修复后再次校验,直到所有数据库文件均通过校验为止。
11、将恢复出来的Oracle数据库附加到原始生产环境的HP-Unix小型机中,尝试启动Oracle数据库,Oracle数据库启动成功。

poYBAGRI4-6ANl0NAAKqcAErQBk915.png

北亚企安数据恢复——LVM数据恢复



12、由用户方配合,启动Oracle数据库和OA服务端。通过本地安装的OA客户端数据记录进行验证,并且用户方安排不同部门人员进行远程验证。经过仔细验证,确定恢复出来的数据完整可用,认可本次数据恢复结果。本次数据恢复工作完成。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    14

    文章

    10438

    浏览量

    91846
  • 数据恢复
    +关注

    关注

    10

    文章

    734

    浏览量

    19073
  • 磁盘
    +关注

    关注

    1

    文章

    403

    浏览量

    26621
  • RAID5
    +关注

    关注

    0

    文章

    140

    浏览量

    13365
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    服务器数据恢复—多次意外断电导致RAID配置丢失的数据恢复案例

    本次故障设备为某品牌DL380系列服务器,设备内配置6硬盘组建RAID5磁盘阵列阵列存放企
    的头像 发表于 05-19 23:13 78次阅读

    服务器数据恢复RAID5阵列同步中断双盘离线 存储崩溃数据恢复案例

    某单位一台存储设备突然崩溃,无法正常访问,急需对存储数据进行恢复。北亚数据恢复工程师和用户方详
    的头像 发表于 04-23 12:49 96次阅读

    服务器数据恢复磁盘柜架构RAID5双盘离线数据恢复实战案例

    ; 2、 数据存储柜:每6硬盘组建1组RAID5阵列,共36组RAID,划分为2个独立
    的头像 发表于 03-24 13:55 201次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>多</b><b class='flag-5'>磁盘</b>柜架构<b class='flag-5'>RAID5</b>双盘<b class='flag-5'>离线</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>实战案例

    服务器数据恢复服务器raid5阵列raid模块损坏的数据恢复案例

    某品牌服务器上面有一组由硬盘组建的riad5阵列。意外断电后管理员重启服务器发现该
    的头像 发表于 01-29 16:46 407次阅读

    服务器数据恢复5RAID5的4盘重建RAID5RAID5数据恢复秘籍!

    一台某品牌服务器,挂接一台同品牌的磁盘阵列,有一组由5硬盘组建的RAID5阵列
    的头像 发表于 11-13 16:20 803次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>5</b>盘<b class='flag-5'>RAID5</b><b class='flag-5'>中</b>的4盘重建<b class='flag-5'>RAID5</b>,<b class='flag-5'>RAID5</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>秘籍!

    服务器数据恢复—硬盘离线raid5阵列崩溃,数据恢复大揭秘

    公司的一台服务器中有一组数硬盘组建的raid5阵列服务器中有一硬盘由于未知原因
    的头像 发表于 11-04 15:32 431次阅读

    服务器数据恢复—EqualLogic存储raid5磁盘阵列数据恢复案例

    服务器存储数据恢复环境&故障: 某品牌EqualLogic PS6100存储阵列上有一组由16
    的头像 发表于 10-21 15:04 515次阅读

    服务器数据恢复—硬盘指示灯亮黄灯,RAID5崩溃数据这样恢复

    服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50的硬盘
    的头像 发表于 10-14 17:17 742次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—硬盘指示灯亮黄灯,<b class='flag-5'>RAID5</b>崩溃<b class='flag-5'>数据</b>这样<b class='flag-5'>恢复</b>

    服务器数据恢复服务器断电导致raid模块损坏的数据恢复案例

    某品牌服务器中有12硬盘,组建了一组raid5磁盘阵列服务器存储的是普通文件。 机房供电
    的头像 发表于 09-04 12:57 1175次阅读

    服务器数据恢复—StorNext文件系统数据丢失的数据恢复案例

    服务器存储数据恢复环境&故障: 一台昆腾存储设备中有一组raid5
    的头像 发表于 08-19 11:43 807次阅读

    服务器数据恢复—坏道“突袭”Raid5阵列数据恢复大揭秘

    北京市某单位的办公用服务器服务器上有一组由6硬盘组建的raid5磁盘阵列服务器崩溃,经
    的头像 发表于 08-05 11:24 833次阅读

    服务器数据恢复raid5阵列硬盘离线导致raid崩溃的数据恢复

    一台服务器中有5硬盘,其中的4组建了一组RAID5阵列,剩下一
    的头像 发表于 07-17 14:37 724次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b><b class='flag-5'>多</b><b class='flag-5'>块</b>硬盘<b class='flag-5'>离线</b><b class='flag-5'>导致</b><b class='flag-5'>raid</b>崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>

    raid5数据恢复Raid阵列重建后如何恢复阵列数据

    raid5阵列数据恢复环境&故障: 一台服务器上有一组raid5
    的头像 发表于 07-10 12:27 781次阅读

    raid5数据恢复raid5阵列热备盘未完全激活导致崩溃的数据恢复案例

    某单位一台EMC某型号存储中有12STAT接口的硬盘,其中10硬盘组建了一组RAID5阵列,剩下2
    的头像 发表于 07-09 11:35 774次阅读

    服务器数据恢复raid5阵列硬盘离线导致EMC存储不可用数据恢复案例

    服务器存储数据恢复环境: EMC某型号存储中有一组由8硬盘组建的
    的头像 发表于 05-29 10:50 668次阅读