存储设备IBM DS5020故障离线怎么办
最新动态来源:本站原创点击数:1251更新时间:2020/7/24
存储设备IBM DS5020故障离线怎么办
近日北亚小编收到来自技术部的解决方案《存储设备IBM DS5020故障离线》,经客户描述故障情况如下:客户故障存储为IBM DS5020存储设备,共创建了四组RAID 5,未设置热备硬盘。在设备使用过程中,其中一组RAID 5上,有2块硬盘先后因故障离线,导致此RAID 5失效,数据无法访问。当遇到这种情况应该怎么办呢?跟着小编继续往下看吧!
经客户描述,设备为IBM DS5020,做的RAID5,主机操作系统为AIX,文件系统类型为JFS2,共16块光纤接口硬盘,存储阵列中两块硬盘故障离线,导致RAID 5阵列失效,系统层AIX小型机无法访问数据。客户联系到北亚数据恢复中心商务人员,数据紧急客户请求远程检测,确定存储阵列的状态。
北亚工程师检测后给出初检方案及过程:
客户故障存储为IBM DS5020存储设备,共创建了四组RAID 5,未设置热备硬盘。在设备使用过程中,其中一组RAID 5上,有2块硬盘先后因故障离线,导致此RAID 5失效,数据无法访问。
客户所需主要数据db2数据库数据。由于系统层为AIX操作系统,数据文件的恢复有一定难度,但问题不大。主要在于不知道db2数据库是否有损坏,若db2数据库有损坏,则还需要单独对db2数据库进行修复。
【数据恢复过程】
1、前期备份流程:将原服务器断电、关机。准备一台恢复操作服务器(北亚提供)、一台备份存储(可北亚提供,也可因数据敏感等原因由用户提供),在恢复平台上以只读方式挂载故障存储,使用北亚磁盘备份工具(或 dd等工具)进行完整的扇区对扇区的备份。备份完成后,提供详细报告,涉及威胁健康状态及可能存在的坏道列表。将原故障存储交回给用户(建议原样恢复),之后不再直接操作原介质。
2、在备份数据中进行分析:分析RAID条带大小、盘序、校验方向的关键信息。判断两块成员盘离线顺序。在剔除一块故障成员盘的情况下,重组RAID。
3、LVM结构检测与修复:生成全部RAID中逻辑卷。分析逻辑卷中的PV信息及LVM池信息。对LVM结构进行重组,获取全部数据LV。
4、文件系统检测与修复:对数据LV进行分析,确定LV中的文件系统类型(JFS2)。对数据LV中的JFS2文件系统结构进行校验。对文件系统进行修复。
5、数据恢复:获取JFS2文件系统中的全部元信息。编写程序对JFS2文件系统进行扫描。编写程序提取JFS2文件系统中全部数据文件。
6、db2数据库校验及修复:对恢复出的db2数据库文件进行完整性和正确性校验。若db2数据库有损坏,尝试对db2数据库进行修复。
【数据恢复时间及结果】