0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HP MSA存储vxfs文件系统数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2023-04-26 16:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

服务器故障环境:

HP MSA某型号存储,8块SAS的硬盘组建RAID5磁盘阵列,其中包括1块热备盘。故障存储中基于该RAID组的LUN均分配给HP-Unix小机使用,上层做的LVM逻辑卷,存储的数据为Oracle数据库及OA服务端。

服务器故障:

RAID5磁盘阵列中2块磁盘未知原因离线,阵列中的热备盘虽然成功激活,RAID5磁盘阵列瘫痪,上层LUN不可用。

服务器数据恢复过程:

1、由于存储中RAID阵列崩溃是由于磁盘掉线导致的,拿到磁盘后先由硬件工程师对故障存储中的所有磁盘做物理故障检测,检测后没有发现硬盘存在物理故障。使用坏道检测工具检测磁盘坏道,也没有发现坏道。

2、将故障存储中所有硬盘以只读方式做完整的镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免数据恢复操作可能对原始数据造成二次破坏。

部分备份数据:

poYBAGRI48yAWKFsAAFfK39vfkU939.png

北亚企安数据恢复——vxfs文件系统数据恢复

3、由于故障存储中所有磁盘不存在物理故障,也没有发现坏道,所以磁盘离线原因就是某些磁盘读写不稳定。因为该品牌存储的RAID控制器针对磁盘的检测策略比较严格,极大可能性把性能不稳定的磁盘认定为坏盘并踢出RAID组。一旦RAID组中掉线的磁盘数量超过该RAID级别允许掉盘的最大数量,这个RAID组就会崩溃,上层基于RAID组的LUN也将不可用。

4、分析RAID组的信息如条带大小,磁盘顺序及数据走向等,然后根据分析获取到的raid信息重构RAID组。经过分析发现其中一块盘的数据和其它盘不太一样,初步判断这块盘就是热备盘。分析其他数据盘(除了热备盘)的底层,搞清楚Oracle数据库页在每个磁盘中分布的情况。

5、分析数据盘中的数据发现有一块硬盘在同一个条带上的数据和其他硬盘不一样,初步判断此盘是先掉线的,通过北亚企安自主开发的RAID校验程序对这个条带做校验,最终确定这块盘就是先掉线的那块硬盘。

6、由于LUN是基于RAID组的,将RAID组重构出来之后就开始分析LUN在RAID组中的分配情况以及LUN分配的数据块MAP。将每一个LUN的数据块分布MAP提取出来,然后针对这些信息编写程序解析所有LUN的数据MAP,然后根据数据MAP导出所有LUN的数据。

poYBAGRI49-AEQyNAAG-HFKlwkY706.png

北亚企安数据恢复——vxfs文件系统数据恢复

7、分析生成出来的所有LUN,发现所有LUN中均包含HP-Unix的LVM逻辑卷信息。尝试解析每个LUN中的LVM信息后发现一共有3个LVM:其中1个LVM中划分了一个LV,里面存放OA服务器端的数据;另外1个LVM中也划分了一个LV,里面存放临时备份数据;最后1个LVM也只划分了一个LV,里面存放Oracle数据库文件。北亚企安数据恢复工程师编写LVM解释程序解释每个LVM中的LV卷,但在解释过程中程序出错。

8、仔细分析程序报错的原因,由开发工程师debug程序出错的位置,并同时检测恢复出来的LUN,检测LMV逻辑卷的信息是否损坏。经过检测发现LVM信息已经损坏。尝试人工修复损坏的区域,并同步修改LVM解释程序重新解析LVM逻辑卷。

9、搭建HP-Unix环境,将解释出来的LV卷映射到HP-Unix并尝试挂载文件系统,结果挂载文件系统出错。尝试使用“fsck –F vxfs” 命令修复vxfs文件系统,修复完成后发现还是不能成功挂载。怀疑是底层vxfs文件系统的部分元数据已经破坏。

10、分析解析出来的LV并根据VXFS文件系统的底层结构校验此文件系统是否完整。分析结果发现底层VXFS文件系统有问题,存储设备瘫痪的时候文件系统正在执行IO操作,部分文件系统元文件损坏。北亚企安数据恢复工程师手工修复这些损坏的元文件,直至VXFS文件系统能够被正常解析。

11、再次将修复好的LV卷挂载到HP-Unix小机上,尝试Mount文件系统,文件系统成功挂载。

12、在HP-Unix小机上mount文件系统后,将所有用户数据均备份至指定的磁盘空间。

部分文件目录:

pYYBAGRI4-eAFRl1AADZ-lwf5uc521.png

北亚企安数据恢复——vxfs文件系统数据恢复

13、使用工具检测每个Oracle数据库文件的完整性,没有发现问题。使用北亚企安自主开发的Oracle数据库检测工具(检验更严格)进行检测,发现有部分Oracle数据库文件和日志文件校验不一致。数据库工程师对这部分文件进行修复并再次校验,直到所有Oracle数据库文件校验通过。

14、将恢复出来的Oracle数据库附加到原始生产环境的HP-Unix服务器中,启动Oracle数据库成功。

poYBAGRI4-6ANl0NAAKqcAErQBk915.png

北亚企安数据恢复——vxfs文件系统数据恢复

数据验证:

在用户方工程师的配合下,启动Oracle数据库和OA服务端。通过笔记本电脑上安装的OA客户端对最新的数据记录以及历史数据记录进行反复验证,并且安排用户方公司不同部门人员进行远程验证。最终确认数据无误,完整可用。本次数据恢复工作完成。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90880
  • RAID
    +关注

    关注

    0

    文章

    286

    浏览量

    37553
  • 数据恢复
    +关注

    关注

    10

    文章

    688

    浏览量

    18802
  • 文件系统
    +关注

    关注

    0

    文章

    301

    浏览量

    20811
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    虚拟化数据恢复—Hyper-V服务瘫痪危机:虚拟机数据文件丢失后的数据恢复案例

    进行检测也没有发现问题,也无被攻击/感染的迹象。对文件系统进行进一步分析,发现元文件创建时间与数据丢失时间一致,服务器数据恢复工程师初步确定
    的头像 发表于 11-20 15:47 170次阅读

    虚拟机数据恢复—异常断电致ESXI存储失联?这份实战数据恢复案例请收好

    服务器存储数据恢复环境: 一台服务器上部署esxi虚拟化平台。上层采用通过FreeNAS构建的iSCSI方式FCSAN功能,FreeNAS层采用UFS2文件系统。 esxi虚拟化
    的头像 发表于 11-11 14:11 113次阅读

    睿擎派文件系统指南:从开发到发布全流程实践 | 技术解析

    在嵌入式系统开发中,文件系统扮演着至关重要的角色,它负责数据的持久化存储、配置文件管理和资源访问等核心功能。睿擎平台提供了一套完整的
    的头像 发表于 11-05 18:13 7697次阅读
    睿擎派<b class='flag-5'>文件系统</b>指南:从开发到发布全流程实践 | 技术解析

    服务器数据恢复—重装系统后OceanStor存储上的分区数据丢失这样恢复

    二为xfs文件系统。 服务器存储故障: 工作人员重装系统操作失误导致磁盘分区变化,分区二无法访问,数据丢失。
    的头像 发表于 09-02 15:32 506次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—重装<b class='flag-5'>系统</b>后OceanStor<b class='flag-5'>存储</b>上的分区<b class='flag-5'>数据</b>丢失这样<b class='flag-5'>恢复</b>

    服务器数据恢复—重装系统导致XFS文件系统分区丢失的数据恢复案例

    服务器数据恢复环境&故障: 一台服务器上通过磁盘柜+RAID卡组建的riad5磁盘阵列,服务器上层安装Linux操作系统,搭建XFS文件系统。服务器上层分配一个LUN,并划分了两个分
    的头像 发表于 06-12 11:20 618次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—重装<b class='flag-5'>系统</b>导致XFS<b class='flag-5'>文件系统</b>分区丢失的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—ocfs2文件系统被格式化为Ext4文件系统数据恢复案例

    服务器存储数据恢复环境&故障: 人为误操作将Ext4文件系统误装入一台服务器存储上的Ocfs2文件系统
    的头像 发表于 06-10 12:03 562次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—ocfs2<b class='flag-5'>文件系统</b>被格式化为Ext4<b class='flag-5'>文件系统</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    Vsan数据恢复——Vsan分布式文件系统上虚拟机不可用的数据恢复

    一台采用VsSAN分布式文件系统存储设备由于未知原因关机重启。管理员发现上层的虚拟机不可用,存储内的数据丢失。
    的头像 发表于 05-15 17:42 425次阅读
    Vsan<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>——Vsan分布式<b class='flag-5'>文件系统</b>上虚拟机不可用的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>

    如何正确选择嵌入式文件系统

    Linux嵌入式系统中,文件系统和缓存机制常导致数据存储稳定性问题。本文通过案例分析原因,对比不同文件系统特性,为开发者提供优化建议,助力提
    的头像 发表于 03-17 11:35 859次阅读
    如何正确选择嵌入式<b class='flag-5'>文件系统</b>?

    虚拟化数据恢复—VMware虚拟化环境下重装系统导致服务器数据丢失的数据恢复

    VMware虚拟化平台 vmfs文件系统 工作人员误操作重装操作系统,服务器崩溃。 重装系统会导致文件系统文件被覆盖。要
    的头像 发表于 03-13 10:33 632次阅读
    虚拟化<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—VMware虚拟化环境下重装<b class='flag-5'>系统</b>导致服务器<b class='flag-5'>数据</b>丢失的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>

    虚拟化数据恢复—误还原快照的数据恢复案例

    虚拟化数据恢复环境&故障: vmfs文件系统存储数据是SqlServer数据库及其他办公
    的头像 发表于 02-07 11:09 630次阅读

    服务器数据恢复—Zfs文件系统服务器数据恢复案例

    服务器数据恢复环境&故障: 一台zfs文件系统的服务器,管理员误操作删除了服务器上的数据
    的头像 发表于 01-16 17:27 631次阅读

    SqlServer数据恢复—SqlServer数据数据恢复案例

    一块硬盘上存放的SqlServer数据库,windows server操作系统+NTFS文件系统。由于误操作导致分区损坏,需要恢复硬盘里的SqlServer
    的头像 发表于 01-09 11:15 753次阅读
    SqlServer<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—SqlServer<b class='flag-5'>数据</b>库<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    防止根文件系统破坏,OverlayRootfs 让你的设备更安全

    多个文件系统层合并成一个单一的视图,在Linux系统中广泛应用。使用OverlayRootfs的设备可以很轻松的实现:根文件系统写保护、恢复出厂设置功能。根
    的头像 发表于 01-08 16:33 2454次阅读
    防止根<b class='flag-5'>文件系统</b>破坏,OverlayRootfs 让你的设备更安全

    XSAN数据恢复-XSAN文件系统数据恢复案例

    XSAN数据恢复环境: 昆腾存储+MAC OS操作系统存储数据主要是视频类
    的头像 发表于 12-30 17:10 689次阅读
    XSAN<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>-XSAN<b class='flag-5'>文件系统</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—ZFS文件系统下RAIDZ数据恢复案例

    : 服务器存储运行过程中突然崩溃,排除人为误操作、断电、进水和其他机房不稳定因素。管理员重启服务器存储系统无法进入,需要恢复服务器存储
    的头像 发表于 12-19 13:31 1024次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—ZFS<b class='flag-5'>文件系统</b>下RAIDZ<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例