0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RAID5多块硬盘离线,热备盘没有激活导致崩溃的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2022-10-20 13:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

服务器数据恢复环境:

IBM某型号服务器,5个SAS硬盘组建RAID5(4个数据盘,1个热备盘);

linux redhat操作系统;

上层应用为oa,数据库为oracle;oracle已经不对本案例中的oa提供后续支持。

服务器故障&初检&恢复方案:

RAID5中有一块盘离线,但热备盘由于未知原因未被激活rebuild,直到另外一块盘离线导致RAID崩溃。用户联系我们数据恢复中心要求恢复数据和操作系统。

经过数据恢复工程师检测,发现热备盘完全没有启用,没有发现有物理故障,也没有同步的表现。

经过北亚数据恢复工程师团队会诊,确定最终的数据恢复方案:

1、关闭服务器,将硬盘标好序号取出。

2、将硬盘挂载到只读环境对所有硬盘做镜像备份。后续的数据恢复操作都在镜像文件上进行,避免对原始数据造成二次破坏。

3、基于镜像文件分析故障RAID5的结构,获取RAID级别、条带规则、条带大小、校验方向、META区域等RAID信息。

4、根据获取到的RAID信息搭建虚拟的RAID5环境。

5、解释虚拟磁盘及文件系统。

6、检测虚拟结构是否正确,如不正确,重复3-5步骤。

7、最终确定数据没有问题后按照用户要求回迁数据。如果仍然使用原盘,需确定已经完全对原盘做过备份之后再重建RAID,然后做回迁。可以使用linux livecd回迁操作系统,也可以在故障服务器上用另外的硬盘安装一个回迁用的操作系统,再进行扇区级别的回迁。

服务器数据恢复过程:

1、对故障服务器中所有硬盘进行完整镜像,镜像过程中发现后掉线的那个硬盘有10-20个坏扇区,其余磁盘均没有发现坏道。

2、分析RAID得到RAID最佳结构、块大小、校验方向等RAID信息,如下图:

poYBAGNQ12mAff2GAAJOfi8KFfE484.png

北亚数据恢复——RAID5数据恢复

3、根据第2步获取到的信息虚拟重建RAID后进行数据验证,200M以上的压缩包解压无报错,确定结构正确。

4、直接按此结构生成虚拟RAID到一块单硬盘上,打开文件系统无明显报错。

5、确定备份包安全的前提下经用户同意后利用原盘重建RAID,重建时已经用全新硬盘更换那块后掉线的已经损坏的硬盘。将恢复好的单盘用USB方式接入故障服务器,用linux SystemRescueCd启动故障服务器。

6、通过dd命令进行全盘回写,启动操作系统。

7、dd所有数据后,启动操作系统但是无法进入,报错:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied。数据恢复工程师怀疑此文件权限有问题,使用SystemRescueCd重启后检查,结果发现此文件时间、权限、大小均有明显错误,这意味着节点损坏。

8、重新分析重组数据中的根分区,定位出错的/sbin/pidof,发现问题是后掉线的那块硬盘坏道所引起的。

9、使用其他完好的3个数据盘对后掉线硬盘的损坏区域进行xor补齐。补齐后重新校验文件系统依然报错误,再次检查inode表,发现后掉线硬盘损坏区域有部分节点表现为(下图中55 55 55部分):

poYBAGNQ13CAesqlAAN3uAwZ2_Q280.png

北亚数据恢复——RAID5数据恢复

很明显,虽然节点中描述的uid还正常存在,但属性、大小、最初的分配块全部是错误的。确定无法找回此损坏节点后只能修复此节点,或复制一个相同的文件过来。

10、对所有可能有错的文件通过日志确定原节点块的节点信息,然后由北亚数据恢复工程师修正。

11、修正后重新dd根分区,执行fsck -fn /dev/sda5命令进行检测,依然报错,如下图:

pYYBAGNQ13WAI9OOAANVx3oVBEk972.png

北亚数据恢复——RAID5数据恢复

12、根据报错提示,在系统中发现有多个节点共用同样的数据块。通过底层分析发现存在节点信息的新旧交集问题。

13、按节点所属的文件进行区别,清除错误节点后执行fsck -fn /dev/sda5,依然有报错但已经很少。根据错误提示发现这些节点多位于doc目录下,不影响系统启动,于是直接使用fsck -fy /dev/sda5命令强行修复。修复后重启系统,成功进入系统桌面。

14、启动oracle数据库服务和OA应用软件,一切正常无报错。

15、让用户亲自对恢复出来的数据和操作系统进行检测,确定没有问题,本次数据恢复工作完成。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    88

    文章

    11628

    浏览量

    217989
  • 服务器
    +关注

    关注

    13

    文章

    10093

    浏览量

    90891
  • 操作系统
    +关注

    关注

    37

    文章

    7329

    浏览量

    128643
  • 数据恢复
    +关注

    关注

    10

    文章

    688

    浏览量

    18802
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    raid5阵列2硬盘先后离线数据恢复案例

    服务器工作状态下raid5中有一硬盘离线
    的头像 发表于 02-22 14:12 1361次阅读
    <b class='flag-5'>raid5</b>阵列2<b class='flag-5'>块</b><b class='flag-5'>硬盘</b>先后<b class='flag-5'>离线</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复-Linux服务器RAID5数据恢复案例

    服务器数据恢复环境: 一台Linux Redhat操作系统服务器上有一组由5硬盘组建的raid5
    的头像 发表于 07-24 17:09 968次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>-Linux服务器<b class='flag-5'>RAID5</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5激活导致阵列崩溃数据恢复案例

    (oracle已经不再为该OA系统提供后续服务支持)。 服务器故障: raid5中一磁盘离线
    的头像 发表于 12-12 13:58 1164次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>热</b><b class='flag-5'>备</b><b class='flag-5'>盘</b>未<b class='flag-5'>激活</b><b class='flag-5'>导致</b>阵列<b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    【服务器数据恢复Raid5硬盘离线导致盘上线同步失败的数据恢复案例

    服务器数据恢复环境: 两组由4磁盘组建的raid5磁盘阵列,两组raid5阵列划分为lun并组成了lvm结构,ext3文件系统。
    的头像 发表于 01-08 13:38 708次阅读

    服务器数据恢复—华为OceanStor存储raid5数据恢复案例

    服务器数据恢复环境: 华为OceanStor某型号存储,存储内有一组由24硬盘组建的raid5阵列,配置1
    的头像 发表于 01-18 11:58 917次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—华为OceanStor存储<b class='flag-5'>raid5</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列硬盘离线激活数据恢复案例

    raid5阵列中两硬盘由于未知故障离线,服务器数据丢失。北亚企安数据
    的头像 发表于 06-06 17:07 833次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b>阵列<b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>且<b class='flag-5'>热</b><b class='flag-5'>备</b><b class='flag-5'>盘</b>未<b class='flag-5'>激活</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5同步过程中硬盘离线数据恢复案例

    某品牌DS5300存储,包含一个存储机头和多个磁盘柜,组建了多组RAID5磁盘阵列。 某个磁盘柜中的一组RAID5阵列由15数据和1
    的头像 发表于 06-20 11:13 703次阅读

    服务器数据恢复—EMC存储中raid5阵列硬盘离线数据恢复案例

    突然崩溃。管理员检查发现存储中的raid5阵列有两硬盘离线,该阵列中的两
    的头像 发表于 07-09 11:58 790次阅读

    服务器数据恢复raid5阵列未完全激活导致阵列崩溃数据恢复案例

    服务器存储数据恢复环境: 北京某企业一台EMC FCAX-4存储上搭建一组由12成员raid5磁盘阵列,其中包括2
    的头像 发表于 07-12 10:58 738次阅读

    服务器数据恢复raid5阵列未全部成功启用的数据恢复案例

    服务器存储数据恢复环境: 一台EMC某型号存储中有一组RAID5磁盘阵列。该raid5阵列中有12
    的头像 发表于 08-14 11:27 851次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b>阵列<b class='flag-5'>热</b><b class='flag-5'>备</b><b class='flag-5'>盘</b>未全部成功启用的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复RAID5阵列硬盘离线激活数据恢复案例

    。 服务器故障: 这组raid5阵列中一磁盘离线,但是
    的头像 发表于 10-15 10:33 911次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b>阵列<b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>但<b class='flag-5'>热</b><b class='flag-5'>备</b><b class='flag-5'>盘</b>未<b class='flag-5'>激活</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复RAID5阵列同步数据失败的数据恢复案例

    使用,存放的数据主要是Oracle数据库。 服务器存储故障: RAID5阵列中1硬盘出现故障
    的头像 发表于 12-04 16:02 1222次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b>阵列<b class='flag-5'>热</b><b class='flag-5'>备</b><b class='flag-5'>盘</b>同步<b class='flag-5'>数据</b>失败的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复RAID5阵列两硬盘离线崩溃数据如何起死回生?

    原因离线自动激活上线替换离线硬盘。在
    的头像 发表于 12-11 13:17 1856次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b>阵列两<b class='flag-5'>块</b><b class='flag-5'>硬盘</b><b class='flag-5'>离线</b><b class='flag-5'>崩溃</b>,<b class='flag-5'>数据</b>如何起死回生?

    raid5数据恢复raid5阵列未完全激活导致崩溃数据恢复案例

    某单位一台EMC某型号存储中有12STAT接口的硬盘,其中10硬盘组建了一组RAID5阵列,剩下2
    的头像 发表于 07-09 11:35 311次阅读

    服务器数据恢复raid5阵列硬盘离线导致raid崩溃数据恢复

    阵列中一离线,但未自动激活rebuild。
    的头像 发表于 07-17 14:37 420次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b>阵列<b class='flag-5'>多</b><b class='flag-5'>块</b><b class='flag-5'>硬盘</b><b class='flag-5'>离线</b><b class='flag-5'>导致</b><b class='flag-5'>raid</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>