0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

服务器数据恢复—磁盘不稳定被踢导致raid5阵列崩溃的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2024-06-12 11:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

服务器存储数据恢复环境:
某品牌MSA2000服务器存储中有一组由8块SAS硬盘组建的raid5磁盘阵列,其中包含一块热备盘。分配了6个LUN,均分配给HP-Unix小机使用。磁盘分区由LVM进行管理,存放的数据主要为Oracle数据库及OA服务端。

服务器存储故障:
服务器存储raid5阵列中有两块硬盘先后离线,服务器瘫痪,无法正常访问lun。

服务器存储数据恢复过程:
1、将所有磁盘编号标记后取出故障服务器存储,硬件工程师分别对服务器中所有磁盘进行物理故障检测和坏道检测,均无异常。
将所有磁盘以只读方式镜像成文件,镜像完成后将所有磁盘按照编号还原到故障存储中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
备份完成的部分数据:

wKgZomZpFfuAdGRFAAGCY5ulPiE439.png北亚企安数据恢复——raid5数据恢复



2、MSA2000存储中一旦某些磁盘读写性能不稳定,该存储中的raid控制器会将这些磁盘识别为坏盘并踢出RAID。一旦RAID中掉线的盘数到达到采用的RAID级别所允许掉盘的极限,RAID不可用,服务器瘫痪。
3、存储中的LUN都是基于RAID的,要想恢复数据就需要先将原始RAID重组出来。分析Oracle数据库页在每个磁盘中分布的情况,并根据数据分布的情况获取RAID条带大小,盘序、数据走向等重组RAID所需要的信息。
4、根据分析出来的RAID信息重组原始RAID。重组完成后分析LUN在RAID中的分配情况,以及LUN分配的数据块MAP。由于有6个LUN,因此只需要将每一个LUN的数据块分布MAP提取出来。北亚企安数据恢复工程师根据这些信息编写相应的程序,解析所有LUN的数据MAP,然后根据数据MAP导出所有LUN的数据。
导出的部分数据:

wKgaomZpFheALyIlAAHsvQsM8Wg858.png北亚企安数据恢复——raid5数据恢复



5、分析所有LUN,发现所有LUN中均包含LVM逻辑卷信息。尝试解析每个LUN中的LVM信息,发现其中一共有三套LVM:第一个LVM中划分了一个LV,存放OA服务器端的数据;第二个LVM中划分了一个LV,存放临时备份数据;剩下的4个LUN组成一个LVM,划分了一个LV,存放Oracle数据库文件。北亚企安数据恢复工程师编写LVM解释程序,尝试解释每套LVM中的LV卷,但是在解释过程中出错。
6、开发工程师debug程序出错的位置,分析程序报错原因,由文件系统工程师对恢复出来的LUN做检测,检测LVM信息是否会因为存储瘫痪而导致LMV逻辑卷的信息损坏。经过检测发现LVM信息确实被破坏。北亚企安数据恢复工程师尝试人工修复损坏的区域,并同步修改程序重新解析LVM逻辑卷。
7、搭建HP-Unix环境,将解释出来的LV卷映射到HP-Unix。尝试Mount文件系统,结果Mount文件系统出错。尝试使用“fsck –F vxfs” 命令修复vxfs文件系统,修复完成还是不能挂载。怀疑vxfs文件系统元数据被破坏。
8、仔细分析解析出来的LV,根据VXFS文件系统的底层结构校验此文件系统的完整性。分析发现VXFS文件系统确实存在问题,存储瘫痪的同时此文件系统正在执行IO操作,因此部分文件系统元文件损坏。人工修复这些损坏的元文件,直到能够正常解析VXFS文件系统。再次将修复好的LV卷挂载到HP-Unix小机上,尝试Mount文件系统,这回文件系统没有报错,成功挂载。
9、在HP-Unix机器上mount文件系统后,将所有用户数据备份至指定空间。
部分文件目录:

wKgaomZpFh6AG940AAEx_hriVWE593.png北亚企安数据恢复——raid5数据恢复



10、使用Oracle数据库文件检测工具“dbv”检测每个数据库文件是否完整,没有发现错误。使用北亚企安自主研发的Oracle数据库检测工具进行检测,发现有部分数据库文件和日志文件校验不一致。由数据库工程师修复此类文件并校验,直到所有文件均通过校验。
11、将恢复出来的Oracle数据库附加到原始生产环境的HP-Unix服务器中,尝试启动Oracle数据库,Oracle数据库启动成功。

wKgZomZpFiWAIjC9AANXE12Fup0339.png北亚企安数据恢复——raid5数据恢复



12、启动Oracle数据库和OA服务端,通过OA客户端对最新的数据记录以及历史数据记录进行验证,并且安排不同部门人员进行远程验证。经过仔细验证,确认数据完整有效。本次数据恢复工作完成。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    13

    文章

    10095

    浏览量

    90901
  • 数据恢复
    +关注

    关注

    10

    文章

    689

    浏览量

    18807
  • RAID5
    +关注

    关注

    0

    文章

    135

    浏览量

    13276
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    服务器数据恢复5RAID5中的4盘重建RAID5RAID5数据恢复秘籍!

    一台某品牌服务器,挂接一台同品牌的磁盘阵列,有一组由5块硬盘组建的RAID5阵列raid5
    的头像 发表于 11-13 16:20 416次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>5</b>盘<b class='flag-5'>RAID5</b>中的4盘重建<b class='flag-5'>RAID5</b>,<b class='flag-5'>RAID5</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>秘籍!

    服务器数据恢复—硬盘离线致raid5阵列崩溃数据恢复大揭秘

    公司的一台服务器中有一组数块硬盘组建的raid5阵列服务器中有一块硬盘由于未知原因离线,服务器崩溃
    的头像 发表于 11-04 15:32 168次阅读

    服务器数据恢复—EqualLogic存储上raid5磁盘阵列数据恢复案例

    服务器存储数据恢复环境&故障: 某品牌EqualLogic PS6100存储阵列上有一组由16块硬盘组建的raid5
    的头像 发表于 10-21 15:04 168次阅读

    服务器数据恢复—硬盘指示灯亮黄灯,RAID5崩溃数据这样恢复

    服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块的硬盘组建了两组RAID5阵列。一组
    的头像 发表于 10-14 17:17 400次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—硬盘指示灯亮黄灯,<b class='flag-5'>RAID5</b><b class='flag-5'>崩溃</b><b class='flag-5'>数据</b>这样<b class='flag-5'>恢复</b>

    服务器数据恢复服务器断电导致raid模块损坏的数据恢复案例

    某品牌服务器中有12块硬盘,组建了一组raid5磁盘阵列服务器内存储的是普通文件。 机房供电不稳定
    的头像 发表于 09-04 12:57 461次阅读

    服务器数据恢复—坏道“突袭”Raid5阵列数据恢复大揭秘

    北京市某单位的办公用服务器服务器上有一组由6块硬盘组建的raid5磁盘阵列服务器崩溃,经
    的头像 发表于 08-05 11:24 554次阅读

    服务器数据恢复raid5阵列多块硬盘离线导致raid崩溃数据恢复

    一台服务器中有5块硬盘,其中的4块组建了一组RAID5阵列,剩下一块盘作为热备盘(Hot-Spare)使用。服务器操作系统为linux,应用
    的头像 发表于 07-17 14:37 421次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>多块硬盘离线<b class='flag-5'>导致</b><b class='flag-5'>raid</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>

    raid5数据恢复Raid阵列重建后如何恢复阵列数据

    raid5阵列数据恢复环境&故障: 一台服务器上有一组raid5
    的头像 发表于 07-10 12:27 458次阅读

    服务器数据恢复——服务器异常断电导致raid模块损坏的数据恢复案例

    服务器上有一组由12块硬盘组建的raid5磁盘阵列。 机房供电不稳定导致机房中该服务器非正常
    的头像 发表于 06-24 16:34 389次阅读

    服务器数据恢复raid5阵列多块硬盘离线导致EMC存储不可用的数据恢复案例

    服务器存储数据恢复环境: EMC某型号存储中有一组由8块硬盘组建的raid5磁盘阵列服务器
    的头像 发表于 05-29 10:50 400次阅读

    服务器数据恢复—双循环raid5磁盘阵列数据恢复案例

    一台服务器上共有10块硬盘,其中的7块硬盘组建了一组raid5磁盘阵列,另外3块硬盘是没有拔掉的掉线磁盘服务器
    的头像 发表于 04-23 14:30 511次阅读

    服务器数据恢复raid5阵列中硬盘坏道导致阵列崩溃数据恢复案例

    服务器存储数据恢复环境: 某品牌DS3512存储中有一组由6块SAS磁盘组建的raid5阵列
    的头像 发表于 03-28 13:25 589次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>中硬盘坏道<b class='flag-5'>导致</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复Raid5阵列热备盘上线失败的数据恢复案例

    服务器数据恢复环境: 某公司一台存储上有一组由15块硬盘组建的raid5阵列raid5
    的头像 发表于 03-26 15:17 525次阅读

    服务器数据恢复服务器raid5阵列硬盘出现坏道掉线如何恢复服务器数据

    一台服务器中有一组由16块SAS接口的硬盘组建的raid5阵列服务器磁盘阵列中有2块硬盘离线,服务
    的头像 发表于 02-28 13:20 660次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>服务器</b><b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>硬盘出现坏道掉线如何<b class='flag-5'>恢复</b><b class='flag-5'>服务器</b><b class='flag-5'>数据</b>?

    服务器数据恢复RAID5阵列两块硬盘离线崩溃数据如何起死回生?

    服务器数据恢复环境: 两组分别由4块SAS接口硬盘组建的raid5阵列,两组raid5
    的头像 发表于 12-11 13:17 1856次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>阵列</b>两块硬盘离线<b class='flag-5'>崩溃</b>,<b class='flag-5'>数据</b>如何起死回生?