0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

服务器数据恢复—RAIDZ多盘离线导致服务器崩溃的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2025-12-11 14:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

服务器存储数据恢复环境&故障:
某存储设备中一共有40块磁盘组建存储池,其中4块磁盘作为全局热备盘使用。存储池内划分出若干空间映射到服务器使用。
服务器存储设备在没有断电、进水、异常操作、供电不稳定等外部因素的情况下突然崩溃。管理员重启服务器后无法进入操作系统,数据丢失。

服务器存储数据恢复过程:
1、将故障存储中所有硬盘做好标记后取出,以只读方式进行完整硬盘镜像。镜像完后把所有磁盘按照编号还原到原存储设备中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析所有磁盘的底层数据,北亚企安数据恢复工程师发现所有磁盘是通过ZFS进行管理,磁盘内记录系统元信息的NVLIST较为混乱。需要恢复数据的磁盘分为三组,每组12块;单个组使用ZFS特有的RAIDZ管理所有磁盘;RAIDZ级别为2,即每个组内可缺失磁盘个数最大为2;全局热备盘全部启用。
Tips:在ZFS文件系统中,池被称为ZPOOL。ZPOOL的子设备可以有很多种类:块设备、文件、磁盘等。本案例中的子设备为三组RAIDZ。
经过分析发现,三组RAIDZ中的两组RAIDZ启用热备盘个数分别为1和3。启用热备盘后,第一组RAIDZ又有一块离线盘,第二组RAIDZ内则又有两块盘离线。
故障模拟:三组RAIDZ内第一和二组RAIDZ中有磁盘离线,热备盘自动上线进行替换;热备盘无冗余情况下第一组RAIDZ中有一块盘离线,第二组RAIDZ中有两块盘离线,ZPOOL进入高负荷状态(每次读取数据都需要进行校验得到正确数据);由于第二组RAIDZ内有三块盘离线,该组RAIDZ崩溃、ZPOOL下线、服务崩溃。
3、ZFS管理的存储池与常规存储不同。ZFS管理的存储池中所有磁盘都由ZFS进行管理。常规RAID在存储数据时,只按照特定的规则组建池,不关心文件在子设备上的位置;而ZFS在存储数据时会为每次写入的数据分配适当大小的空间,并通过计算得到指向子设备的数据指针。这种特性决定了RAIDZ缺盘时无法直接通过校验得到数据,必须将整个ZPOOL作为一个整体进行解析。
北亚企安数据恢复工程师手工截取事务块数据,并编写程序获取最大事务号入口。

poYBAGPy6-KAFxqYAADd361-wn8329.png北亚企安数据恢复—RAIDZ数据恢复



4、获取到文件系统入口后,北亚企安数据恢复工程师编写数据指针解析程序进行地址解析。

poYBAGPy6_2AALL5AAHaeE9FbWY604.png北亚企安数据恢复—RAIDZ数据恢复



5、获取到文件系统入口点在各磁盘分布情况后,北亚企安数据恢复工程师手工截取并分析文件系统内部结构。入口分布所在的磁盘组无缺失盘,可直接提取信息。数据恢复工程师根据ZFS文件系统的数据存储结构找到映射的LUN名称,从而找到其节点。
6、经过分析,数据恢复工程师发现在此存储中的ZFS版本与开源版本有较大差别,无法使用以前开发的解析程序解析,所以北亚企安数据恢复工程师重新编写了数据提取程序提取数据。

pYYBAGPy7AWAJIXgAAIoBbKg260170.png北亚企安数据恢复—RAIDZ数据恢复



由于磁盘组内缺盘个数较多,每个IO流都需要通过校验得到,提取进度极为缓慢。与用户方沟通后得知,此ZVOL卷映射到XenServer作为存储设备,需要恢复的文件在其中一个vhd内。提取ZVOL卷头部信息,按照XenStore卷存储结构进行分析,发现该vhd在整个卷的尾部,计算得到其起始位置后从此位置开始提取数据。
7、Vhd提取完毕后,验证其内部的压缩包及图片、视频等文件,均可正常打开。
8、用户方验证数据后,确定恢复出来的文件数量与系统自动记录的文件个数基本一致,文件全部可正常打开。本次数据恢复工作完成。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    14

    文章

    10467

    浏览量

    91888
  • 数据恢复
    +关注

    关注

    10

    文章

    736

    浏览量

    19087
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    服务器数据恢复—多次意外断电导致RAID配置丢失的数据恢复案例

    本次故障设备为某品牌DL380系列服务器,设备内配置6块硬盘组建RAID5磁盘阵列,阵列中存放企业内部办公文件及重要机密业务数据服务器日常运行期间突发崩溃宕机,设备无法正常访问。
    的头像 发表于 05-19 23:13 106次阅读

    服务器硬盘损坏数据恢复,北亚数据恢复案例

    的真实案例,为大家讲解服务器硬盘损坏后的数据恢复流程。 服务器数据恢复环境: 本次故障
    的头像 发表于 04-28 14:06 242次阅读
    <b class='flag-5'>服务器</b>硬盘损坏<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>,北亚<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器RAID阵列故障数据恢复典型案例与技术解析

    案例一:6RAID6离线数据库与网站文件完整恢复。案例二:4
    的头像 发表于 03-31 17:26 377次阅读

    服务器数据恢复—断电致虚拟机不可用,LVM损坏数据库碎片重组恢复案例

    北亚数据恢复中心最近接到很多服务器数据恢复的案子,这些案子有:服务器断电
    的头像 发表于 03-17 14:40 213次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—断电致虚拟机不可用,LVM损坏<b class='flag-5'>数据</b>库碎片重组<b class='flag-5'>恢复</b>案例

    服务器数据恢复】从崩溃到重生:16服务器RAID与EXT4文件系统深度修复实录

    服务器运维过程中,硬盘掉线是导致服务器故障、数据丢失的常见原因。针对普通服务器硬盘掉线引发的数据
    的头像 发表于 03-10 16:52 510次阅读

    服务器数据恢复掉线RAID6数据恢复:基于Reed-Solomon算法的修复

    ,当第三块硬盘离线后,RAID崩溃服务器瘫痪,业务被迫停滞。 此时,如果直接更换硬盘重新组建阵列,阵列中的所有数据将全部丢失。服务器管理
    的头像 发表于 03-05 16:37 547次阅读

    服务器数据恢复服务器raid5阵列raid模块损坏的数据恢复案例

    某品牌服务器上面有一组由块硬盘组建的riad5阵列。意外断电后管理员重启服务器发现该服务器无法使用。 根据用户方描述的情况,服务器
    的头像 发表于 01-29 16:46 415次阅读

    服务器数据恢复服务器“泡水”硬盘掉线,数据竟这样恢复

    北亚企安数据恢复中心的服务器数据恢复工程师和硬件工程师到现场处理故障。服务器
    的头像 发表于 01-22 17:38 1189次阅读
    【<b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>】<b class='flag-5'>服务器</b>“泡水”硬盘掉线,<b class='flag-5'>数据</b>竟这样<b class='flag-5'>恢复</b>

    服务器数据恢复—一文读懂服务器高频故障排查+标准数据恢复流程

    服务器数据恢复到底是一个什么样的流程? 服务器数据丢失后,进行数据
    的头像 发表于 01-08 11:11 539次阅读

    服务器数据恢复—硬盘离线致raid5阵列崩溃数据恢复大揭秘

    公司的一台服务器中有一组数块硬盘组建的raid5阵列。 服务器中有一块硬盘由于未知原因离线服务器崩溃,存储重要
    的头像 发表于 11-04 15:32 436次阅读

    服务器数据恢复RAIDZ块硬盘离线导致服务器崩溃数据恢复案例

    服务器数据恢复环境&故障: 一台服务器有32块硬盘,采用Windows操作系统。 服务器在正常运行的时候突然变得不可用。没有异常断电、进
    的头像 发表于 09-18 12:29 1147次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAIDZ</b><b class='flag-5'>多</b>块硬盘<b class='flag-5'>离线</b><b class='flag-5'>导致</b><b class='flag-5'>服务器</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复服务器断电导致raid模块损坏的数据恢复案例

    某品牌服务器中有12块硬盘,组建了一组raid5磁盘阵列,服务器内存储的是普通文件。 机房供电不稳定导致服务器断电,管理员重启服务器后发现
    的头像 发表于 09-04 12:57 1196次阅读

    服务器数据恢复服务器上的卷被误删数据如何恢复

    工作人员不慎将一台服务器上的卷误删除,服务器上有一组raid5阵列。需要恢复误删除的数据
    的头像 发表于 08-14 11:33 1183次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>服务器</b>上的卷被误删<b class='flag-5'>数据</b>如何<b class='flag-5'>恢复</b>?

    服务器数据恢复—硬盘离线导致raid上层的卷无法挂载的数据恢复案例

    服务器数据恢复环境&故障: 某公司一台服务器上有一组由24块FC硬盘组建的raid。 服务器出现故障,无法正常工作。 经过初步检测,管
    的头像 发表于 07-29 13:00 786次阅读

    服务器数据恢复—raid5阵列块硬盘离线导致raid崩溃数据恢复

    一台服务器中有5块硬盘,其中的4块组建了一组RAID5阵列,剩下一块作为热备(Hot-Spare)使用。服务器操作系统为linux,应用系统为构架于oracle
    的头像 发表于 07-17 14:37 739次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—raid5阵列<b class='flag-5'>多</b>块硬盘<b class='flag-5'>离线</b><b class='flag-5'>导致</b>raid<b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>