0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

服务器数据恢复—RAIDZ多块硬盘离线导致服务器崩溃的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2025-09-18 12:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

服务器数据恢复环境&故障:
一台服务器有32块硬盘,采用Windows操作系统
服务器在正常运行的时候突然变得不可用。没有异常断电、进水、异常操作、机房不稳定等外部因素。服务器管理员重启服务器,但是服务器无法进入系统。管理员联系北亚企安数据恢复工程师要求恢复服务器数据。

服务器数据恢复过程:
1、将故障服务器上所有硬盘做好标记后取出,经过硬件工程师检测后没有发现有硬盘存在硬件故障。将所有硬盘以只读方式进行扇区级完整镜像,镜像完成后将所有硬盘根据标记按照原样还原到原服务器中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析所有磁盘底层数据,经过分析发现:故障服务器采用zfs文件系统。所有磁盘组建了几组RAIDZ。热备盘全部启用。
在服务器ZFS文件系统中,池被称为ZPOOL。ZPOOL的子设备可以有很多种类,包括块设备、文件、磁盘等等,本案例中就是三组RAIDZ作为子设备。
经过分析发现,三组RAIDZ中的两组RAIDZ分别启用1个和3个热备盘。热备盘启用后,第一组RAIDZ又有一块盘离线,第二组RAIDZ则有两块硬盘离线。
通过上述分析结果模拟故障:三组RAIDZ中的两组RAIDZ出现离线盘,热备盘自动上线替换。热备盘无冗余状态下,其中一组RAIDZ出现离线硬盘的RAIDZ又有一块盘离线,另外一组RAIDZ中又出现两块离线盘。ZPOOL进入高负荷状态;2块盘离线的RAIDZ中又有第三块盘离线,RAIDZ崩溃、ZPOOL下线、服务器崩溃。
3、重组ZPOOL,追踪数据入口。
ZFS对所有磁盘进行统一管理。在数据存储时,ZFS会为每次写入的数据分配适当大小的空间,并计算得到指向子设备的数据指针。这种精细化的管理方式使得ZFS能够更高效地利用磁盘空间,并且在数据存储和检索时更加灵活和智能。
当出现缺盘情况时,常规RAID和ZFS的处理方式也截然不同。常规RAID通常可以通过校验机制,利用剩余磁盘上的数据来恢复丢失的数据,因为它在存储时已经按照固定的规则分布了校验信息。
但对于ZFS管理的存储池,当RAIDZ(ZFS的一种RAID实现方式)缺盘时,无法直接进行校验得到数据。这是因为ZFS的存储特性使得数据和校验信息的分布更为复杂,必须将整个ZPOOL(ZFS存储池)作为一个整体进行解析,才能尝试恢复数据。这种方式虽然在缺盘恢复时相对复杂,但也保证了数据的完整性和一致性。
北亚企安数据恢复工程师手工截取事务块数据,编写程序获取最大事务号入口。
获取文件系统入口:

poYBAGPXjteAYKqIAADc-xdnpeU334.png北亚企安数据恢复—RAIDZ数据恢复



获取到文件系统入口后,北亚企安数据恢复工程师编写数据指针解析程序进行地址解析。
解析数据指针:

pYYBAGPXjuqAImmWAAHZUUYdpwY537.png北亚企安数据恢复—RAIDZ数据恢复



获取到文件系统入口点在各磁盘分布情况后,数据恢复工程师开始手工截取并分析文件系统内部结构。经过分析发现入口分布所在的磁盘组无缺失盘,可直接提取信息。根据ZFS文件系统的数据存储结构顺利找到映射的LUN名称,进而找到其节点。
4、经过分析发现此存储中的ZFS版本与开源版本有较大差别,无法使用原先开发的解析程序进行解析,所以数据恢复工程师重新编写数据提取程序。

pYYBAGPXjvqAX4_cAAIdFaUwaGE563.png北亚企安数据恢复—RAIDZ数据恢复



由于磁盘组内缺盘个数较多,每个IO流都需要通过校验得到,提取进度极为缓慢。与用户方沟通后得知,此ZVOL卷映射到XenServer作为存储设备,用户方所需的文件在其中一个vhd内。提取ZVOL卷头部信息,按照XenStore卷存储结构进行分析,发现该vhd在整个卷的尾部,计算得到其起始位置后从此位置开始提取数据。
5、Vhd提取完成后,验证其内部的压缩包及图片、视频等文件,均可正常打开。
交由用户方验证数据,经过验证发现文件数量与系统自动记录的文件个数一致。验证文件可用性,文件全部可正常打开,服务器数据恢复工作完成。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    13

    文章

    10095

    浏览量

    90899
  • RAID
    +关注

    关注

    0

    文章

    286

    浏览量

    37554
  • 数据恢复
    +关注

    关注

    10

    文章

    689

    浏览量

    18804
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    服务器数据恢复硬盘离线致raid5阵列崩溃数据恢复大揭秘

    公司的一台服务器中有一组数硬盘组建的raid5阵列。 服务器中有一硬盘由于未知原因
    的头像 发表于 11-04 15:32 168次阅读

    服务器数据恢复硬盘指示灯亮黄灯,RAID5崩溃数据这样恢复

    服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50硬盘组建了两组RAID5阵列。一组raid5阵列
    的头像 发表于 10-14 17:17 399次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>硬盘</b>指示灯亮黄灯,RAID5<b class='flag-5'>崩溃</b><b class='flag-5'>数据</b>这样<b class='flag-5'>恢复</b>

    服务器数据恢复服务器断电导致raid模块损坏的数据恢复案例

    某品牌服务器中有12硬盘,组建了一组raid5磁盘阵列,服务器内存储的是普通文件。 机房供电不稳定导致
    的头像 发表于 09-04 12:57 459次阅读

    服务器数据恢复—坏道“突袭”Raid5阵列,数据恢复大揭秘

    北京市某单位的办公用服务器服务器上有一组由6硬盘组建的raid5磁盘阵列。 服务器崩溃,经
    的头像 发表于 08-05 11:24 554次阅读

    服务器数据恢复硬盘离线导致raid上层的卷无法挂载的数据恢复案例

    服务器数据恢复环境&故障: 某公司一台服务器上有一组由24FC硬盘组建的raid。
    的头像 发表于 07-29 13:00 444次阅读

    服务器数据恢复—raid5阵列硬盘离线导致raid崩溃数据恢复

    一台服务器中有5硬盘,其中的4组建了一组RAID5阵列,剩下一盘作为热备盘(Hot-Spare)使用。
    的头像 发表于 07-17 14:37 421次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—raid5阵列<b class='flag-5'>多</b><b class='flag-5'>块</b><b class='flag-5'>硬盘</b><b class='flag-5'>离线</b><b class='flag-5'>导致</b>raid<b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>

    服务器数据恢复—raid5阵列硬盘离线导致EMC存储不可用的数据恢复案例

    服务器存储数据恢复环境: EMC某型号存储中有一组由8硬盘组建的raid5磁盘阵列。 服务器
    的头像 发表于 05-29 10:50 400次阅读

    服务器数据恢复—Linux系统服务器崩溃数据恢复案例

    服务器数据恢复环境: linux操作系统服务器中有一组由4SAS接口硬盘组建的raid5阵列
    的头像 发表于 05-20 15:46 553次阅读

    服务器数据恢复—raid5阵列中硬盘坏道导致阵列崩溃数据恢复案例

    文件。 存储中的数据包括:数十台iunx系统虚拟机和windows系统虚拟机、压缩包文件、配置文件。 服务器存储故障: raid5阵列中
    的头像 发表于 03-28 13:25 589次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—raid5阵列中<b class='flag-5'>硬盘</b>坏道<b class='flag-5'>导致</b>阵列<b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—如何预防服务器故障与恢复服务器数据

    服务器常见故障: 硬件故障:磁盘损坏、电池故障等。 软件问题:操作系统崩溃、未知的程序运行错误等。 病毒破坏:勒索病毒加密、删除服务器数据等。 不可控力量;
    的头像 发表于 03-11 12:36 816次阅读

    服务器数据恢复服务器raid5阵列硬盘出现坏道掉线如何恢复服务器数据

    一台服务器中有一组由16SAS接口的硬盘组建的raid5阵列。 服务器磁盘阵列中有2硬盘
    的头像 发表于 02-28 13:20 660次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>服务器</b>raid5阵列<b class='flag-5'>硬盘</b>出现坏道掉线如何<b class='flag-5'>恢复</b><b class='flag-5'>服务器</b><b class='flag-5'>数据</b>?

    服务器数据恢复服务器硬盘灯闪黄灯的数据恢复案例

    ,而其他颜色的灯没有亮的话,通常表示这块硬盘出现故障,这时候更换新硬盘同步数据即可。 如果没有及时发现硬盘损坏或者更换硬盘失败
    的头像 发表于 01-03 13:23 1016次阅读

    服务器数据恢复—如何让ZFS文件系统数据“起死回生”?

    一台配有32硬盘服务器在运行过程中突然崩溃不可用。经过初步检测,基本上确定服务器硬件不存在物理故障。管理员重启
    的头像 发表于 01-02 14:17 803次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—如何让ZFS文件系统<b class='flag-5'>数据</b>“起死回生”?

    服务器数据恢复—ZFS文件系统下RAIDZ数据恢复案例

    服务器存储数据恢复环境: ZFS Storage 7320存储阵列中有32硬盘。32
    的头像 发表于 12-19 13:31 1034次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—ZFS文件系统下<b class='flag-5'>RAIDZ</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—RAID5阵列两硬盘离线崩溃数据如何起死回生?

    服务器数据恢复环境: 两组分别由4SAS接口硬盘组建的raid5阵列,两组raid5阵列划分LUN并由LVM管理,格式化为EXT3文件系
    的头像 发表于 12-11 13:17 1856次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—RAID5阵列两<b class='flag-5'>块</b><b class='flag-5'>硬盘</b><b class='flag-5'>离线</b><b class='flag-5'>崩溃</b>,<b class='flag-5'>数据</b>如何起死回生?