0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HP EVA存储硬盘读写不稳定离线的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2023-02-28 11:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

服务器故障&检测&分析:

HP EVA存储设备中的RAID5磁盘有两块硬盘掉线,lun丢失。硬件工程师对故障服务器进行物理故障检测,发现掉线硬盘能够正常读取,无物理故障,也没有发现坏道。

故障服务器掉线硬盘没有物理故障,所以掉线极有可能是硬盘读写不稳定造成的。EVA控制会将读写不稳定的硬盘默认为坏盘并踢出。raid5冗余允许最大掉线硬盘的数量是2,掉线的硬盘超过了2块就会导致服务器崩溃。

通过分析故障服务器内raid条目的存储形式,发现每个硬盘的不同块组成一个raid条目。通过分析后解析出来raid条目信息,发现每个LUN都有一份LUN_MAP。由于EVA将LUN_MAP分别存放在不同的磁盘中,用一个索引来指定其位置,因此在磁盘中找出这个指定LUN_MAP位置的索引就可以找到现存LUN的信息。

服务器数据恢复过程:

1、将故障存储中所有硬盘连接到北亚企安数据恢复平台上,以只读方式将硬盘数据镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始数据造成二次破坏。

2、通过故障分析确定硬盘掉线的原因是读写不稳定,被控制器踢出掉线。这些掉线的硬盘中有一部分数据是老旧数据,LUN使用的是RAID5,只需要将一个LUN的RAID条目通过RAID5的校验算法算出校验值,再和原有的校验值做比较就可以判断这个条目中是否有掉线盘。

将一个LUN的所有LUN_MAP都校验一遍就可以知道这个LUN中的哪些RAID条目中有掉线盘。在这些RAID条目中都存在的那个盘就一定就是掉线盘。排除掉线盘后根据LUN_MAP即可恢复所有LUN的数据。由北亚企安数据恢复工程师编写相对应程序来实现这个方案,根据编写好的程序去实现不同的功能:

a、编写程序扫描全部LUN_MAP,结合人工分析获取到LUN_MAP。

b、编写检测RAID条目的程序检测所有LUN中掉线的磁盘,结合人工分析排除掉线的磁盘。

c、编写LUN数据恢复程序,结合LUN_MAP恢复所有LUN数据。

恢复出所有LUN的数据后由人工核对每个LUN,验证是否和用户方工程师描述的一致。

3、根据用户方工程师描述,所有LUN的数据可以分成两部份:1、Vmware的虚拟机;2、HP-UX上的裸设备,裸设备存放Oracle的dbf数据库。由于通过恢复出来的LUN无法看到里面的文件,因此需要人工核对哪些LUN是存放Vmware的数据,哪些LUN是HP-UX上的裸设备。核对完成后将不同的LUN挂载到不同的验证环境中进行验证。

4、将所有存放vmware虚拟机数据的LUN里面的虚拟机文件都生成出来,通过NFS共享的方式挂载到虚拟主机上,然后将虚拟机一个一个添加到清单。所有虚拟机加电开机后都能启动系统。用户方工程师亲自对虚拟机里面的数据进行验证没有发现问题。本次数据恢复工作完成。

服务器数据安全Tips:

1、定期巡查服务器&存储设备,发现报警及时处理。

2、操作要谨慎,避免误操作导致设备数据丢失。

3、如果发现EVA控制器模块不稳定,应当及时更换。

4、本案例中的EVA存储故障是由磁盘读写不稳定导致的,如果EVA存储中所有磁盘(掉线和没有掉线的)是同一批次,这些没有掉线的磁盘也应该快到极限,如果有条件建议更换掉这批磁盘。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4693

    浏览量

    89568
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90879
  • 数据恢复
    +关注

    关注

    10

    文章

    688

    浏览量

    18799
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    服务器数据恢复硬盘离线致raid5阵列崩溃,数据恢复大揭秘

    公司的一台服务器中有一组数块硬盘组建的raid5阵列。 服务器中有一块硬盘由于未知原因离线,服务器崩溃,存储重要数据的D分区无法识别。
    的头像 发表于 11-04 15:32 163次阅读

    服务器数据恢复—RAIDZ多块硬盘离线导致服务器崩溃的数据恢复案例

    服务器数据恢复环境&故障: 一台服务器有32块硬盘,采用Windows操作系统。 服务器在正常运行的时候突然变得不可用。没有异常断电、进水、异常操作、机房不稳定等外部因素。服务器管
    的头像 发表于 09-18 12:29 510次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—RAIDZ多块<b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>导致服务器崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    JGN8-M18-OP接近开关信号不稳定怎么办

    接近开关信号不稳定可能是由于传感器输入的电压或电流不足、信号线路松动或受到干扰、传感器接线不正确、传感器供电电源不稳定
    的头像 发表于 07-10 11:28 616次阅读

    服务器数据恢复—raid5阵列多块硬盘离线导致EMC存储不可用的数据恢复案例

    服务器存储数据恢复环境: EMC某型号存储中有一组由8块硬盘组建的raid5磁盘阵列。 服务器
    的头像 发表于 05-29 10:50 397次阅读

    服务器数据恢复—NAS存储硬盘出现故障的数据恢复案例

    NAS数据恢复环境: QNAP TS-532X NAS设备中有两块1T的SSD固态硬盘和3块5T的机械硬盘。三块机械硬盘组建了一组RAID
    的头像 发表于 04-24 14:38 605次阅读

    驱动板输出不稳定的原因分析

    驱动板输出不稳定可能由多种因素引起。
    的头像 发表于 02-13 11:50 967次阅读

    信号不稳定?TNC 插头特定型号帮你解决

    德索工程师说道作为一名深耕电子设备领域的工程师,在长期实践中,信号不稳定始终是一个极具挑战性的难题。无论是通信基站、工业自动化设备,还是测试仪器,一旦信号出现不稳定的情况,就会引发数据传输中断、设备运行异常等一系列严重问题,不仅
    的头像 发表于 02-12 08:49 653次阅读
    信号<b class='flag-5'>不稳定</b>?TNC 插头特定型号帮你解决

    信号线电压不稳定原因分析

    在电子设备和通信系统中,信号线作为数据传输的关键通道,其电压稳定性直接关系到系统的性能和稳定性。当信号线电压出现不稳定现象时,可能会导致数据
    的头像 发表于 01-29 16:47 2720次阅读

    如何解决电磁流量计读数不稳定的问题

    电磁流量计以其高精度和高可靠性在工业流体测量中占据着重要地位。然而,由于多种因素的影响,电磁流量计的读数可能会出现不稳定的情况。 电磁流量计读数不稳定的原因 流体特性变化 :流体的电导率、温度和密度
    的头像 发表于 01-24 10:05 1467次阅读

    故障自查指南|数据采集卡/信号采集不稳定怎么办?一文教你搞定!

    在进行数据采集时,信号的不稳定性往往会影响到采集结果的准确性和可靠性。本文我们将分析可能导致信号采集不稳定的原因,并提出相应的解决方案。
    的头像 发表于 12-26 16:00 2013次阅读

    SATA硬盘与SSD的区别 SATA硬盘读写速度分析

    SATA硬盘与SSD的区别 1. 存储介质 SATA硬盘 :通常指的是机械硬盘(HDD),使用磁碟和读写头来
    的头像 发表于 12-19 14:35 8499次阅读

    服务器数据恢复—ZFS文件系统下RAIDZ数据恢复案例

    : 服务器存储运行过程中突然崩溃,排除人为误操作、断电、进水和其他机房不稳定因素。管理员重启服务器存储,系统无法进入,需要恢复服务器存储
    的头像 发表于 12-19 13:31 1024次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—ZFS文件系统下RAIDZ<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    变频器输出出现不稳定现象原因及维修

          变频器作为现代工业自动化设备中的核心部件,其稳定运行对于生产线的效率和安全至关重要。然而,在实际应用中,变频器输出出现不稳定现象是一个较为常见的问题,这不仅会影响设备的正常运行,还可
    的头像 发表于 12-16 07:44 3180次阅读
    变频器输出出现<b class='flag-5'>不稳定</b>现象原因及维修

    服务器数据恢复—RAID5阵列两块硬盘离线崩溃,数据如何起死回生?

    服务器数据恢复环境: 两组分别由4块SAS接口硬盘组建的raid5阵列,两组raid5阵列划分LUN并由LVM管理,格式化为EXT3文件系统。 服务器故障: RAID5阵列中一块硬盘
    的头像 发表于 12-11 13:17 1856次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—RAID5阵列两块<b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>崩溃,<b class='flag-5'>数据</b>如何起死回生?

    LDC1314采集的数据始终不稳定,而且采集距离很短,怎么解决?

    LDC1314采集的数据始终不稳定,初值经常改变,而且采集距离很短,有什么方法可以解决这两个问题呢??
    发表于 12-09 07:24