您所在的位置:首页 > 成功案例 > RAID数据恢复

浅析RAID0/1安全差别及处理数据安全的应对方式

最新动态来源:本站原创点击数:393更新时间:2020/1/8

RAID0/1分析背景
基于之前接到用户的委托,萌生想要尝试分析下RIAD0/1的安全差别,希望给更多需要的朋友带来帮助。用户的设备信息如下:
1、SCSI RAID0+1,由4块36G SCSI组成
2、经与用户沟通,用户表明是做了两组RAID1。出故障后,RAID状态里3块盘OFFLINE。
RAID0/1数据分析步骤
将硬盘单独接在SCSI适配器上,进入系统,硬盘无异常,可以正常识别。经分析,无明显RAID信息区域,之后对4块盘做比较,结论是1、3号盘及2、4号盘每组都有相同性,但后面有大量不一致数据。1号盘及2号盘里有分区表,每个分区表里的描述都大约指出原逻辑盘分区总和大约68G。
据此,可判断有以下三种情况:
1、两组RAID0,但1、3号及2、4号均有部分完全相同的数据,应该可以排除。
2、RAID1+0(即两两做RAID1,再做RAID0,这种安全级别高),经后续对硬盘的监控发现,两组RAID1中先后都有一块硬盘离线(此后就相当于RAID0,再不能提供任何冗余)。再后来,又有一块硬盘离线,系统崩溃。这种情况非常符合RAID里的表现。
3、RAID0+1(即两两做RAID0,再做RAID1,这种不太好,推断可能性不大)
根据分析后,发现除1、3组成的RAID,无任何错误。重组数据。直接写回RAID,系统正常可以启动。文件访问也正常。但是,数据经用户查看发现是几年前的数据,并不是当前需要的那部分。
RAID0/1数据分析结论
经再次与用户详细沟通了解到:用户早期做了RAID0+1,结果组成RAID1中的其中一组RAID0中有一块盘离线(应该为1或3),导致整个RAID0离线(两块离线了),之后一直以单RAID0的方式工作,直到最近,剩下的一组RAID0中有一块盘离线,RAID彻底瘫痪。用户使用的RAID卡为ADAPTEC的0通道RAID卡,无法安全缓冲数据,最后离线时,因数据部分未写入等原因导致文件系统一致性有问题。最终重新组织3及5号盘,修正错误,经用户再次验收查看后数据无误,至此数据恢复工作结束。
RAID0/1安全差别分析
通过上述案例表明RAID0+1及RAID1+0的安全差别,那么下面为大家细说下这部分。
1、 RAID0+1:
结构为,两块以上(含两块)硬盘先做条带(RAID0),组成相同的两组一级逻辑盘。再将两组逻辑盘做镜像(RAID1)。如下图:

RAID0+1的冗余性(安全性):只要有一块盘出错,它所在的RAID0就会整体离线,只能靠最外层的RAID1的冗余来支撑。实际上,只能允许一块盘出错,这样如果在4块以上的硬盘盘阵中,安全性实际会差得多。
利用率:1/2
效率:读与写均可以实现N/2(N为硬盘总数)的理论带宽
实现:容易,控制器无需强劲处理能力,通常也无需大缓冲。
2、RAID1+0:
结构为,两块以上硬盘先做镜像(RAID1),组成相同的两组或两组以上一级逻辑盘。再将两组(或两组以上)逻辑盘做条带(RAID0)。如下图:
RAID1+0的冗余性(安全性):只要有一块盘出错,它所在的RAID1中不会有问题,所以每组RAID1中都允许有一块盘离线。安全性:损坏两块盘崩溃的机会只有2/(N-1)。
利用率:1/2
效率:读与写均可以实现N/2(N为硬盘总数)的理论带宽
实现:容易,控制器无需强劲处理能力,通常也无需大缓冲。
RAID0/1安全差别分析结论
上述分析,可以明显看到,RAID1+0比RAID0+1的安全级别会高很多,其他参数却相同。所以,需要安全级别高的场合下,一定要选择RAID1+0。实际上,RAID0+1是华而不实的结构,很少会有它的适用场合。本文提及的案例,如果用户使用的是RAID1+0,出故障的概率便会低得多了。