干货 | RAID6与RAID5数据安全性对比 2024-08-03 10:32:25 差一点 我们就擦肩而过了公益干货有收获问题描述磁盘阵列(disk array)可以有效的提高存储系统的可靠性和性能,同时也存在显著的缺点,那就是由于多个设备(磁盘)同时使用,导致了可靠性降低(从概率的角度来讲:N个设备的可靠性是一个设备的1/N)。解决方案RAID(Redundant array of inexpensive disk)就是为了解决这个问题而产生的,RAID通过给磁盘阵列增加冗余磁盘提高了磁盘阵列的可靠性。所谓冗余磁盘,即该磁盘不用于存放实际数据,而用来存放一些冗余信息,而这些冗余信息可用来在必要的时候进行有效数据恢复,从而增加磁盘阵列的可靠性,翻译成中文应该叫廉价磁盘冗余阵列。在RAID6出现之前,RAID已经有了从RAID0~RAID5六个版本。那么我们已经有了这么多的RAID方式,提供了相当级别的可靠性保护,为什么我们还需要RAID6?在这里,我们这里先比较研究一下几种比较有代表性的RAID方式:磁盘冗余家族概览目前应用最广泛,支持设备最多的RAID方式主要是RAID0,RAID1和RAID5(1)无冗余(RAID0):RAID0实际上不能算做真正的RAID技术,它只是实现了磁盘阵列存放数据的带状分布。虽然提高了大规模数据访问的性能,但是RAID0并没有冗余容错的功能,因为它本身并无冗余,所以可以说这里的RAID0是个误称(2)镜像(RAID1):RAID1同样实现了数据的带状分布,与RAID0所不同的是,在数据写入一个磁盘的时候,同时在另一个磁盘做相应的镜象。因此,RAID1虽然有数据容错功能,但是其对磁盘的利用率实在比较底,仅为50%。(3)奇偶校验(RAID5):相对于RAID1比较,RAID5也是仅仅实现了单个磁盘的冗余纠错功能,但是却大大提高了磁盘的有效利用率。以RAID5(4D P)为例子来讲,使用4块磁盘存放数据位,使用1块磁盘存放校验位。其基本原理是这样的:根据条带化的数据4D(使用四位数据)生成一位的校验信息,存放在第五块磁盘中。生成P校验位的公式一般是这样的:P = D1 ⊕ D2 ⊕ D3P为校验位,D1~D3分别代表三个数据位,⊕表示异或操作。可以看到,当D1,D2,D3中其余的一个数据丢失的时候,可以利用其余的三个数据位和校验位P进行恢复,具体的恢复公式如下:例如,当D1丢失的时候,D1 = D2 ⊕ D3 ⊕ P同时可以看到,当两快磁盘出现故障的时候,RAID5无法恢复。RAID6:突破磁盘冗余局限RAID5已经提供了一定程度的可靠性,然而也牺牲了一定的读取速度。特别是在RAID重构作业中,大量的数据读写操作增加硬盘的负担,旧的硬盘更容易发生故障。RAID5的局限性还表现在RAID5仅能在一块硬盘发生故障的情况下修复数据,如果2块硬盘同时发生故障,RAID5则无能为力。以前,两块盘同时坏的情况是小概率事件,几乎不可能发生。但是近来随着光纤(FC)盘和SATA盘的容量和密度不断增加,(欢迎关注公众号:网络工程师阿龙)使得RAID 5的重建时间也不断增加。两块硬盘同时损坏的概率也大幅增加,在企业级存储上,这种风险必须得到重视。所以RAID6应需诞生了。RAID6同RAID5最大的区别就是在RAID5的基础上除了具有P校验位以外,还加入了第2个校验位Q位。以RAID6(6D 1P 1Q)为例子,这个系统需要8块硬盘,其中6块用于存放数据,1块用于存放P校验位,1块用于存放Q校验位。当然,我得又一次强调,并非某个具体的独立的盘全部用来存放P校验信息,另外一个Q校验信息。而是对于某个位组(6个数据位 P位 Q位)来说,采用某种原则,6块盘上存放数据位,1块盘存放P位,1块盘用来存放Q位。其数学原理如下:校验位的生成:P = D1 ⊕ D2 ⊕ D3Q = GF(D1) ⊕ GF(D2) ⊕ GF(D3)注:D1~D3:条带化的数据P:P校验位Q:Q校验位⊕:异或操作GF(D1):对D1位进行Galois Field变换。当一块磁盘出现数据错误或者丢失的时候,恢复方法同RAID5,无须使用Q校验位。当两块磁盘上的数据出现错误或者丢失的时候,恢复方法为:利用上边给出的P,Q的生成公式,联立方程组,无论受损的数据是否包括P或者Q,总是能够解出损失的两位的数据。RAID6与RAID5数据安全性比较:针对同样是8个磁盘,数据利用率同样是75%,但分别用RAID5和RAID6进行构建的磁盘阵列情况进行比较。一个用两个独立的RAID5(3D 1P)构建;另一个用RAID6(6D 1P 1Q)构建,应用伯努利(Bernoulli)概率分布分析如下( 假设单个磁盘在10年内出现故障的概率是):两个独立的RAID5(3D 1P)构建的系统数据安全的概率分析:在三种情况下,该系统的数据是安全的:1. 8个磁盘都没有损坏的情况,概率是2. 8个磁盘只有一个损坏的情况,概率是3. 两个独立RAID5(3D 1P)系统中,各损坏一个磁盘的情况,概率是所以,两个独立的RAID5(3D 1P)构建的系统数据安全的总概率是一个RAID6(6D 1P 1Q)构建的系统数据安全的概率分析:1. 8个磁盘都没有损坏的情况,概率是 [与上个系统相同]2. 8个磁盘只有一个损坏的情况,概率是 [与上个系统相同]3. 8个磁盘中有两个损坏的情况,概率是所以,一个RAID6(6D 1P 1Q)构建的系统数据安全的总概率是实际一点,假设单个磁盘在10年内出现故障的概率是 ,则用RAID5构建的系统,十年内不出故障的安全概率为99.881629%;对比用RAID6构建的系统,十年内不出故障的安全概率为99.994607%。可见,RAID6的数据安全级别是相当高的。当然RAID5的安全性也相当好了。从上面数据看起来,两者相差不大。(欢迎关注公众号:网络工程师阿龙)但是对于出现故障的概率RAID5是0.118371%, RAID6是0.005393%.这样看来,提高还是很大的。随着磁盘的容量越来越大导致数据出错概率 的增大。两者的差距还会进一步加大,RAID6的优势就更明显了。而当磁盘容量增至20多TB的时候,RAID6的安全性比RAID5已经高出1000倍左右。总结篇RAID6与RAID5区别总结如下:RAID6是在RAID5的改进,RAID6不仅能在一个磁盘离线的情况下将数据恢复(使用和RAID5一样的异或校验),而且由于用了两个盘作为纠错盘,所以能应付两个磁盘同时离线的情况。1、冗余和数据恢复能力2、读写性能差别3、硬盘利用率在使用大数据块的情况下,RAID6的随机读取性能很好;因为不但要在每硬盘上写入校验数据而且要在专门的校验硬盘上写入数据,RAID6的随机写入性能很差。RAID6的持续写入性能一般,在使用小数据块时表现很好。总体而言,RAID6拥有更快速的读取性能,更高的容错能力。但同时,RAID6也存在写入速度很慢的缺点,RAID控制器在设计上更加复杂,成本更高。声明:来源于华为案例库,在此致谢。编辑:网络工程师阿龙end 赞 (0) 相关推荐 RAID0 和JBOD区别 RAID是独立磁盘冗余阵列(Redundant Array of IndependentDisks)的简写,简称磁盘阵列.其基本思想就是把几个相对便宜的磁盘通过特定方式组合起来,使其在容量.可靠性等性 ... 「干货」图文并茂磁盘阵列RAID详解 独立硬盘冗余阵列(RAID, Redundant Array of Independent Disks),旧称廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks ... 产品干货:如何用数据指标衡量产品迭代效果? 诸葛君说:一款成功的互联网产品离不开一次又一次的正确决策,特别是在一家互联网公司,产品承载着整个公司的商业价值,以腾讯早期的代表的「小步快跑.快速迭代」模式被认为是互联网产品生存的基本法则. 一.产品 ... 月底了,送上表间数据快速对比的2种方法【视频】,希望能帮上忙 月底了,送上表间数据快速对比的2种方法【视频】,希望能帮上忙 哈登跟韦德体测数据大对比,一块腹肌的哈登比韦德跳的还高! 韦德和哈登都是NBA联盟中顶尖的后卫.而且两人同样是欧洲步高手.韦德外号闪电侠,巅峰韦德一步能过掉任何防守者,然后上演惊天暴扣.哈登在人们的印象中除了一块腹肌,更多的是高球商,地板流,碰瓷的代表.然而 ... 【论文写作纯干货】基于医案数据的名老中医经验总结论文写作框架 ⊙编辑:一墨 做好名老中医药专家学术经验传承工作,培养高层次中医药人才,探索建立中医药学术传承及推广应用的有效方法和创新模式,是中医药发展的重大任务.名老中医医案是名老中医学术思想与经验的载体,是名老 ... 各国数据汇总对比:注射冠状病毒疫苗后感染人数下降了吗? 来源:卡卡西农场 自新冠病毒疫苗问世后,各国争相接种.但注射后对病毒的预防效果如何?我们先来看各国注射疫苗与感染人数的汇总对比. 一.注射疫苗后感染暴涨国家: 1.泰国 始于2021年3月1日 ... Excel报表设置数据条对比分析 [最新消息重磅发布]Excel老学员必看 德州扑克干货:20个数据,让你进阶德州扑克高手 德州扑克,一个需要运气实力才能征服的游戏,虽说运气不是我们能掌控的,但我们却可以依靠以下这些数据让运气的影响力变成最低,让实力成为赢牌的最重要因素. 如果大家没有完全了解以下这20个数据,最好还是先别 ... 尿路上皮癌:白蛋白结合型紫杉醇与紫杉醇的有效性和安全性对比 重要性 铂类难治性转移性尿路上皮癌(mUC)的治疗选择有限,且预后仍然很差.在先前的一项单臂试验中,白蛋白结合型紫杉醇(nab-paclitaxel)显示出有希望的活性和耐受性. 目的 评估比较在铂类 ... 【干货分享】用大数据为你分析白酒行业不可忽视的未来,看完就懂! 十年的时间对于中国白酒行业来说不能算长也不能算短,在漫漫的白酒文化长河中十年只不过是沧海一粟,中国的白酒历史见证了无数的十年历程,走过了无数的春夏秋冬. 商业终归是商业,总要遵循商业发展的印记和规律, ...