0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HP EVA存储硬盘读写不稳定离线的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2023-02-28 11:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

服务器故障&检测&分析:

HP EVA存储设备中的RAID5磁盘有两块硬盘掉线,lun丢失。硬件工程师对故障服务器进行物理故障检测,发现掉线硬盘能够正常读取,无物理故障,也没有发现坏道。

故障服务器掉线硬盘没有物理故障,所以掉线极有可能是硬盘读写不稳定造成的。EVA控制会将读写不稳定的硬盘默认为坏盘并踢出。raid5冗余允许最大掉线硬盘的数量是2,掉线的硬盘超过了2块就会导致服务器崩溃。

通过分析故障服务器内raid条目的存储形式,发现每个硬盘的不同块组成一个raid条目。通过分析后解析出来raid条目信息,发现每个LUN都有一份LUN_MAP。由于EVA将LUN_MAP分别存放在不同的磁盘中,用一个索引来指定其位置,因此在磁盘中找出这个指定LUN_MAP位置的索引就可以找到现存LUN的信息。

服务器数据恢复过程:

1、将故障存储中所有硬盘连接到北亚企安数据恢复平台上,以只读方式将硬盘数据镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始数据造成二次破坏。

2、通过故障分析确定硬盘掉线的原因是读写不稳定,被控制器踢出掉线。这些掉线的硬盘中有一部分数据是老旧数据,LUN使用的是RAID5,只需要将一个LUN的RAID条目通过RAID5的校验算法算出校验值,再和原有的校验值做比较就可以判断这个条目中是否有掉线盘。

将一个LUN的所有LUN_MAP都校验一遍就可以知道这个LUN中的哪些RAID条目中有掉线盘。在这些RAID条目中都存在的那个盘就一定就是掉线盘。排除掉线盘后根据LUN_MAP即可恢复所有LUN的数据。由北亚企安数据恢复工程师编写相对应程序来实现这个方案,根据编写好的程序去实现不同的功能:

a、编写程序扫描全部LUN_MAP,结合人工分析获取到LUN_MAP。

b、编写检测RAID条目的程序检测所有LUN中掉线的磁盘,结合人工分析排除掉线的磁盘。

c、编写LUN数据恢复程序,结合LUN_MAP恢复所有LUN数据。

恢复出所有LUN的数据后由人工核对每个LUN,验证是否和用户方工程师描述的一致。

3、根据用户方工程师描述,所有LUN的数据可以分成两部份:1、Vmware的虚拟机;2、HP-UX上的裸设备,裸设备存放Oracle的dbf数据库。由于通过恢复出来的LUN无法看到里面的文件,因此需要人工核对哪些LUN是存放Vmware的数据,哪些LUN是HP-UX上的裸设备。核对完成后将不同的LUN挂载到不同的验证环境中进行验证。

4、将所有存放vmware虚拟机数据的LUN里面的虚拟机文件都生成出来,通过NFS共享的方式挂载到虚拟主机上,然后将虚拟机一个一个添加到清单。所有虚拟机加电开机后都能启动系统。用户方工程师亲自对虚拟机里面的数据进行验证没有发现问题。本次数据恢复工作完成。

服务器数据安全Tips:

1、定期巡查服务器&存储设备,发现报警及时处理。

2、操作要谨慎,避免误操作导致设备数据丢失。

3、如果发现EVA控制器模块不稳定,应当及时更换。

4、本案例中的EVA存储故障是由磁盘读写不稳定导致的,如果EVA存储中所有磁盘(掉线和没有掉线的)是同一批次,这些没有掉线的磁盘也应该快到极限,如果有条件建议更换掉这批磁盘。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4934

    浏览量

    90386
  • 服务器
    +关注

    关注

    14

    文章

    10438

    浏览量

    91846
  • 数据恢复
    +关注

    关注

    10

    文章

    734

    浏览量

    19073
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    服务器硬盘损坏数据恢复,北亚数据恢复案例

    的真实案例,为大家讲解服务器硬盘损坏后的数据恢复流程。 服务器数据恢复环境: 本次故障服务器采用多块硬盘
    的头像 发表于 04-28 14:06 225次阅读
    服务器<b class='flag-5'>硬盘</b>损坏<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>,北亚<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—RAID5阵列同步中断双盘离线 存储崩溃数据恢复案例

    某单位一台存储设备突然崩溃,无法正常访问,急需对存储数据进行恢复。北亚数据恢复工程师和用户方详
    的头像 发表于 04-23 12:49 96次阅读

    【服务器数据恢复EVA4400/6400/8400存储底层原理及数据恢复全流程

    难度极高。 EVA存储所用FC磁盘本质为SAS盘转接实现,加之虚拟化存储持续数据迁移、业务负载高,磁盘易故障掉线,最终突破冗余保护导致存储
    的头像 发表于 02-24 15:55 227次阅读
    【服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>】<b class='flag-5'>EVA</b>4400/6400/8400<b class='flag-5'>存储</b>底层原理及<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>全流程

    【服务器数据恢复EVA存储硬盘离线,LUN丢后数据如何“重生”?

    将故障EVA存储设备上的所有硬盘编号后取出。硬件工程师对所有硬盘进行硬件故障检测。检测后发现掉线硬盘不存在物理故障和坏道。将所有
    的头像 发表于 01-22 17:39 1319次阅读

    服务器数据恢复—EqualLogic存储硬盘离线导致上层虚拟机不可用的数据恢复案例

    某公司IT部门一台EqualLogic 6100存储设备突然崩溃。 经过初步检查发现服务器存储崩溃的原因是该存储一组阵列上的2块硬盘出现故障离线
    的头像 发表于 01-20 14:52 231次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—EqualLogic<b class='flag-5'>存储</b><b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>导致上层虚拟机不可用的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—RAIDZ多盘离线导致服务器崩溃的数据恢复案例

    存储设备中一共有40块磁盘组建存储池,其中4块磁盘作为全局热备盘使用。存储池内划分出若干空间映射到服务器使用。 服务器存储设备在没有断电、进水、异常操作、供电
    的头像 发表于 12-11 14:16 424次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—RAIDZ多盘<b class='flag-5'>离线</b>导致服务器崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复硬盘离线致raid5阵列崩溃,数据恢复大揭秘

    公司的一台服务器中有一组数块硬盘组建的raid5阵列。 服务器中有一块硬盘由于未知原因离线,服务器崩溃,存储重要数据的D分区无法识别。
    的头像 发表于 11-04 15:32 431次阅读

    服务器数据恢复—EqualLogic存储上raid5磁盘阵列数据恢复案例

    服务器存储数据恢复环境&故障: 某品牌EqualLogic PS6100存储阵列上有一组由16块硬盘组建的raid5磁盘阵列。磁盘阵列上层
    的头像 发表于 10-21 15:04 515次阅读

    服务器数据恢复—RAIDZ多块硬盘离线导致服务器崩溃的数据恢复案例

    服务器数据恢复环境&故障: 一台服务器有32块硬盘,采用Windows操作系统。 服务器在正常运行的时候突然变得不可用。没有异常断电、进水、异常操作、机房不稳定等外部因素。服务器管
    的头像 发表于 09-18 12:29 1137次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—RAIDZ多块<b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>导致服务器崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—服务器断电导致raid模块损坏的数据恢复案例

    某品牌服务器中有12块硬盘,组建了一组raid5磁盘阵列,服务器内存储的是普通文件。 机房供电不稳定导致服务器断电,管理员重启服务器后发现服务器无法正常工作。 根据描述的故障发生过程,北亚企安
    的头像 发表于 09-04 12:57 1175次阅读

    服务器数据恢复硬盘离线导致raid上层的卷无法挂载的数据恢复案例

    服务器数据恢复环境&故障: 某公司一台服务器上有一组由24块FC硬盘组建的raid。 服务器出现故障,无法正常工作。 经过初步检测,管理员发现导致服务器故障的原因是raid中有两块硬盘
    的头像 发表于 07-29 13:00 778次阅读

    服务器数据恢复—raid5阵列多块硬盘离线导致raid崩溃的数据恢复

    阵列中一块盘离线,但热备盘未自动激活rebuild。直到另外一块盘离线,RAID崩溃。 由于oracle已经不再对本案例中的oa系统提供后续支持,用户方要求尽可能恢复数据和操作系统。经过检测发现热备盘完全没有启用,
    的头像 发表于 07-17 14:37 724次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—raid5阵列多块<b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>导致raid崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>

    JGN8-M18-OP接近开关信号不稳定怎么办

    接近开关信号不稳定可能是由于传感器输入的电压或电流不足、信号线路松动或受到干扰、传感器接线不正确、传感器供电电源不稳定
    的头像 发表于 07-10 11:28 1443次阅读

    工厂电压不稳定,选 380V 交流稳压器看这里!

    工厂电压不稳定时,选择380V交流稳压器可从额定功率、稳压范围、输入输出电压范围、精度、保护功能、效率、品牌质量等方面综合考虑,以下是具体建议:
    的头像 发表于 06-17 11:11 1394次阅读

    服务器数据恢复—raid5阵列多块硬盘离线导致EMC存储不可用的数据恢复案例

    服务器存储数据恢复环境: EMC某型号存储中有一组由8块硬盘组建的raid5磁盘阵列。 服务器
    的头像 发表于 05-29 10:50 668次阅读