热备盘上线失败导致raid5阵列崩溃的数据恢复案例
最新动态来源:本站原创点击数:117更新时间:2024/8/9
服务器数据恢复环境&故障:
两组分别由4块SAS硬盘组建的raid5磁盘阵列,ext3文件系统+lvm结构。
磁盘阵列中一块硬盘离线,热备盘自动上线替换离线硬盘并开始同步数据。在热备盘同步数据的过程中该组raid中另外一块硬盘出现故障掉线,该组Raid阵列崩溃,LVM结构不完整,文件系统不可用,服务器瘫痪。
管理员检查掉线的两块硬盘,前面掉线的硬盘无法识别,后掉线的硬盘可以识别。
服务器数据恢复方案:
1、硬件工程师将存在故障的掉线硬盘修复,修复完成后以只读方式做全盘镜像。
2、将raid阵列中其他完好的硬盘和另一组正常raid中的所有磁盘进行全盘备份。
3、基于镜像文件分析raid相关信息,根据分析获取到的raid信息重组阵列。
4、找到LVM信息并重组LVM卷。
5、分析EXT3文件系统,恢复并导出全部数据。
服务器数据恢复过程:
1、由硬件工程师对无法识别的离线硬盘在无尘工作间进行开盘操作,开盘后发现硬盘盘片磨损严重,无法恢复数据,在后续的数据恢复过程中只能将这块硬盘按照缺盘状态进行处理。
2、将掉盘raid阵列中其他完好硬盘和正常阵列中的全部硬盘以只读方式进行扇区级全盘镜像。镜像完成后将所有硬盘按照原样还原到原服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
3、基于镜像文件分析所有磁盘底层数据,获取原raid中的校验方式、条带大小,硬盘盘序等重组raid所需要的raid信息。根据分析获取到的raid信息重组raid。
4、raid重组完成后开始分析底层数据,尝试分析lvm结构相关信息并导出作为pv的lun,重组pv并重新生成lvm逻辑卷。
5、LVM卷重组之后,使用北亚企安自主开发的文件系统解析程序对LV(逻辑卷)中的EXT3文件系统进行解析,恢复并导出EXT3文件系统的全部数据。
6、由于阵列中的先离线的那块硬盘盘片划伤严重且无法修复,而且部分硬盘中存在坏道,raid结构存在缺陷。但经过用户方检验后,发现用户需要的文件都在,认可数据恢复结果。