0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分布式数据恢复-hbase+hive分布式存储误删除文件的数据恢复方案

Frombyte 来源:Frombyte 作者:Frombyte 2023-11-24 15:55 次阅读

hbase+hive分布式存储数据恢复环境:
16台某品牌R730XD服务器节点,每台物理服务器节点上有数台虚拟机,虚拟机上配置的分布式,上层部署hbase数据库+hive数据仓库。

hbase+hive分布式存储故障&初检:
数据库文件被误删除,数据库无法使用。
通过现场对该分布式环境的初步检测,发现虚拟机还可以正常启动,虚拟机里面的数据库块文件丢失。好在块文件丢失之后没有对集群环境写入数据,底层数据损坏可能性比较小。

hbase+hive分布式存储数据恢复方案:
1、备份。
A、从物理服务器底层做备份,将设备断电、关机。将所有磁盘编号后从服务器/存储中取出。
B、从虚拟机层面备份,通过网络直接备份虚拟机底层磁盘文件。
C、北亚企安数据恢复中心准备一台服务器以只读方式挂载服务器硬盘,对所有磁盘进行扇区对扇区的全盘镜像备份。
D、备份完成后提供详细报告,内容涉及所有磁盘的健康状态和存在的坏道列表。
E、将服务器硬盘按照编号还原到原服务器/存储设备中,之后数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。

2、基于镜像文件分析块文件结构。
A、分析每个虚拟机磁盘的块文件。
B、分析文件底层的聚合方式。
C、分析磁盘中数据分布情况。

3、分析Block文件key。
A、定位数据库文件中的key信息
B、提取并解析数据库文件中key信息。
C、整合数据库文件key信息。

4、拼接Block文件。
A、根据Block文件的key信息提取文件片段。
B、拼接Block文件的片段。
C、校验拼接后的Block文件的正确性。

5、导入Block文件。
A、校验提取出来的Block文件完整性和正确性。
B、把提取出来的Block文件导入到hbase和hive数据仓库中。

6、验证数据。
由用户对数据进行详细验证。如果发现问题则重新检验上面的恢复流程。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据恢复
    +关注

    关注

    10

    文章

    418

    浏览量

    16881
  • 分布式
    +关注

    关注

    1

    文章

    754

    浏览量

    74090
收藏 人收藏

    评论

    相关推荐

    鸿蒙原生应用开发——分布式数据对象

    分布式数据对象退出 sessionId 后,该对象将检测不到其他对象的变更。 02、分布式数据对象能力 1、分布式
    发表于 12-08 10:01

    HarmonyOS分布式文件系统开发指导

    监听、通过软总线建立链路,并根据分布式的设备安全等级执行不同的数据流转策略。 ● hmdfs:实现在内核的网络文件系统,包括缓存管理、文件访问、元
    发表于 11-14 17:14

    数据数据恢复-数据库文件删除/分区被格式化的SQL SERVER数据恢复方案

    数据数据恢复-数据库文件删除/分区被格式化的SQL SERVER数据
    的头像 发表于 09-21 14:34 467次阅读

    服务器数据恢复-LINUX下误删除/格式化的数据恢复方案

    服务器数据恢复环境: 基于EXT2/EXT3/EXT4/Reiserfs/Xfs文件系统的Linux操作系统。 服务器故障: LINUX操作系统下误删除/格式化
    的头像 发表于 09-15 15:29 556次阅读

    过程语言(2)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 23:00:52

    过程语言(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 23:00:11

    课程介绍(2)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:59:24

    课程介绍(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:58:59

    #分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:58:32

    聚合函数(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:57:57

    窗口函数(2)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:57:17

    窗口函数(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:55:17

    嵌套查询(2)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:50:06

    嵌套查询(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:49:29