热备盘上线过程中硬盘离线导致阵列崩溃的数据恢复案例
最新动态来源:本站原创点击数:58更新时间:2024/9/19
服务器磁盘阵列数据恢复环境:
服务器中有两组分别由4块SAS硬盘组建的raid5磁盘阵列,两组raid5阵列划分LUN,组成LVM结构,格式化为EXT3文件系统。
服务器磁盘阵列故障:
服务器中一组raid5阵列中有一块硬盘离线,热备盘自动上线替换离线硬盘。热备盘上线同步数据过程中又有一块硬盘离线,热备盘同步失败,该组raid5阵列崩溃,LVM结构变得不完整,文件系统无法使用。
硬件工程师对两块离线硬盘进行硬件故障检测,发现先离线硬盘无法识别,初步判断该硬盘存在硬件故障,需要进行开盘修复。后离线硬盘可以正常识别。
服务器磁盘阵列数据恢复过程:
1、在无尘工作间将检测出硬件故障,先离线的硬盘进行开盘操作。开盘后发现盘片磨损严重,无法修复,只能对故障磁盘阵列进行缺盘处理。
2、将服务器上出现故障raid中的其他硬盘编号后取出,以只读方式将所有磁盘进行扇区级全盘镜像,并且将另一组完好raid的全部成员盘进行全盘只读镜像。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
3、基于镜像文件分析所有硬盘底层数据。通过解析EXT3文件系统结构,分析出两组raid5阵列的盘序、条带大小、校验方向等raid相关信息。根据分析出来的raid信息重组这两组raid5阵列(对故障raid进行重组时进行缺盘处理)。
4、重组出两组raid5阵列之后,分析这两组raid中的底层数据,找到LVM结构信息。对LVM结构进行分析,将两组raid中作为PV(LVM物理卷)的LUN导出,将两个PV重组并重新生成LVM逻辑卷。
5、恢复并导出数据。LVM重组之后,使用北亚企安自主开发工具解析LV(逻辑卷)中的EXT3文件系统,恢复并导出其中的全部数据。