HP EVA系列存储常见故障有哪些?如何恢复数据?
最新动态来源:本站原创点击数:498更新时间:2023/3/13
服务器数据恢复环境(EVA系列存储)介绍:
EVA系列存储是一套"虚拟"磁盘阵列存储解决方案,其结构不同于基于RAID的普通存储,在HP公司内部被称为VRAID。
EVA对每个物理磁盘(PV)进行签名(写在每个磁盘的0扇区),签名后每个物理磁盘(PV)会被分配进不同的DISK GROUP。在DISK GROUP中,每个PV会按一定大小划分为若干存储单元(PP),PP的大小为2的整数次幂,在2-16M之间。
每个PV中有一定数量的PP,这些PP共同构建了DISK GROUP的可用空间。PV按照5-15组成若干组RSS(常规RAID的冗余组),但这个冗余组不等同于常规RAID,常规RAID是以磁盘为单位的RAID算法,而RSS是基于PP的RAID算法。
EVA会轮流分配不同的RSS组,这些RSS之间的数据存储是基于JBOD的,每个RSS组成的stripe的成员其实是不同PV中不同位置的PP。
无论RSS中成员数量有多少个,对于VRAID5,一个stripe中的PV数总是5个。对于VRAID6,一个stripe中的PV数总是6个。例如,对于VRAID5,EVA会尽可能在N个磁盘中做C(N,5)的组合情况,以期实现IO负载均衡。
当一个RSS中某个PV离线,控制器会从同一个RSS组中其他磁盘(同一条带中已存在的PV之外)中寻找可用的PP,在逻辑上实现每个stripe的rebuild,从而保证整个存储的安全性。
当一个RSS中损坏的磁盘数量少于或者等于6个,RSS的安全性降低,EVA会合并此RSS到另一个RSS中,可用的冗余空间就可以共享,空间就可以从另一个较安全的RSS中迁移过来。
为了保证有足够的空间提供冗余保护,在创建DISK GROUP时,EVA会提供一个Protection Level的保护级别,single表示用2个磁盘的空间做冗余 ,double表示用4个磁盘的空间做冗余。但这个冗余不同于hotspare,这个冗余空间仅会预留到每个PV的尾部。
EVA系列存储常见故障:
1、RSS中多个磁盘掉线,超过冗余保护级别规定的数量。
2、加入新磁盘后迁移数据时,新磁盘存在物理故障(此时无法回退/前进)。
3、误删除VDISK或EVA initialize。
4、主机与存储无法连接,无法discover存储。
EVA系列存储数据恢复原理:
eva系列存储最核心的结构来自于所有vdisk的运算pp map表,pp map表会因为磁盘的不断迁移而迁移。所有的故障均可基于此pp map表恢复。
当pp map表不存在时,根据不同的条带之间的冗余关系,可使用优化算法对所有PP进行条带性集合,形成若干组正确的条带数据;基于文件系统结构、数据结构等特征重组若干条带。
EVA系列存储数据恢复过程:
1、将EVA主机一端的连线拔出,直接连入主机hba卡上,对所有磁盘做镜像备份。因eva主机与扩展柜之间多是铜线连接,故而,可能需要在扩展柜上增加光纤收发模块,再通过光链路接入fc hba卡上。当然,也可以把所有硬盘拆下来后,放入其他光纤通道柜中进行镜像。
2、通过北亚企安自研的frombyte recovery for hp eva程序重组vdisk,直接写入成镜像文件或目标物理磁盘。
3、解释镜像文件或目标磁盘,迁移镜像或导出内部文件。