热备盘同步失败导致raid5阵列崩溃的数据恢复案例
最新动态来源:本站原创点击数:139更新时间:2024/7/15
服务器存储数据恢复环境:
华为S5300存储中有一组由16块FC硬盘组建的RAID5磁盘阵列(包含一块热备盘)。
服务器存储故障:
该存储中的RAID5阵列1块硬盘由于未知原因离线,热备盘上线并开始同步数据,数据同步到50%左右时另外一块硬盘离线,同步失败,raid5阵列瘫痪,上层lun不可用。
服务器存储数据恢复过程:
1、将故障存储中所有磁盘编号后取出,由硬件工程师对所有磁盘进行物理故障检测,经过检测发现先离线的磁盘存在物理故障,其他硬盘均不存在物理故障。将所有磁盘以只读方式做扇区级全盘镜像,存在物理故障的硬盘在硬件工程师处理后也进行完整镜像。镜像完成后将所有磁盘按照编号还原到原存储中。
2、基于镜像文件分析所有磁盘底层数据,分析获取到raid磁盘顺序、数据走向、条带大小等重组raid所必需的raid相关信息。根据分析获取到的RAID信息将原始RAID重组出来。
3、分析lun在阵列中的分配状态和lun分配的数据块,根据数据MAP导出LUN的数据。
4、由于是使用热备盘虚拟重组的RAID结构,EXT3文件系统无法正常挂载。于是数据恢复工程师只能将oracle数据库文件提取出来,利用北亚企安自主开发的文件系统解释程序对其进行文件系统解释,然后导出oracle数据库文件。将数据库文件移交给数据库工程师进行校验和验证。
5、使用Oracle数据库文件检测工具检测每个数据库文件的完整性,经过检测发现错误。使用北亚企安自主研发的Oracle数据库检测工具检测,发现有部分数据库文件和日志文件错误, system和sysaux表空间各存在上百个坏块;3个控制文件存在许多坏块,全部损坏;eschoolspace表空间的3个文件则有上千个坏块;undotbs02丢失;数据库工程师对此类文件进行修复。
6、创建控制文件和undo表空间,启动数据库到mount。system数据文件坏块导致数据库无法open,各种隐含参数也不能绕过system的坏块。搭建数据库环境并使用dmp文件还原数据库。
7、在用户方的配合下,在本地虚拟机安装OA客户端并启动Oracle数据库。通过OA客户端对数据记录进行验证,并且安排不同部门人员进行远程验证。经过多部门验证,用户方最终确认恢复数据有效,认可数据恢复结果。