保障带重复数据删除的存储系统可靠性方法

带重复数据删除的归档存储系统获得了更好的存储空间利用率是以降低数据可靠性为代价的,这在很多实际应用尤其是长期归档系统中是不可接受的。因此,在带重复数据删除的存储系统中,尤其在带重复数据删除的大规模归档存储系统中,如何保证数据可靠性是一个关键问题。Bhagwat,等人[100]首先注意到了这一问题,并初步定最分析了重复数据删除给存储系统可靠性所带来的后果。

总结起来,当前为带重复数据删除的存储系统提供可靠性主要有以下两类方法。


1.基干复制伪可靠性算法保证


Bhagwat等人[100]提出了一种根据数据块的重要性为其保存若干份副本的方法。这是一种自然、简单的想法,但它需要占用很大的存储空间,并且系统通信量也随着副本份数的增多而增大,这些特性抉定了其在大规模存储系统中的表现会比较低效[45],[112]。而且,Bhagwat的研究并没有考虑数据块的实际放置方法。Google公司的Googlefilesystem(GFS)[35]也采用了副本的方法来增强系统的可靠性。在GPS中,文件被分成固定大小的块,每个块由一个不变的、全局唯一的64位的chunk-handle标志。为了提高系统的可靠性,每一个数据块被复制成若干份存放在不同的服务器上。默认情况下,系统保存三个副本,但用户可以自己指定副本的数目。管理器在创建新块时考虑了数据块的分布,如优先放置在空间利用率低的磁盘上,同一份数据的副本放在不同的机器上等。


通过复制保证系统的可靠性是一种自然、简单的想法,但它需要占用的存储空间较大,并且系统通信量也随着副本份数的增多而增大,这在一定程度上限制了其在大规模存储系统中的使用。


2.基干RAID类系统的可靠性保证


直接使用RAID类(RAID-likesystem)系统作为底层的存储系统,这也是提高系统可靠性的一种常用方法。该方法对上层透明,容易实现和部署。但是传统RAID系统(RAID1-RAID5)的容错能力是极其有限的,无法容忍两块硬盘同时发生故障的情况。一旦存储系统中两块硬盘同时损坏,以往的RAID技术对此就无能为力了,这是对系统容错性要求很高的归档存储系统所不能容忍的。为了克服这一缺点,RAID6引入了双垂校验机制,通过使用基于Galoisfield算法或有限场的数学MDS代码,在驱动器上对数据进行编码校验,可以容忍任意两块磁盘的错误。J.s.plank[113]提出了一种易于转换成系统实现的RAID6编码。RAID6比RAID5具有更高的容错性,但也引入了更人的系统开销,复杂的校验计算使其较难扩展到大规模海量存储架构中使用。另外,类RAID系统只能进行整盘恢复,数据恢复时延相对较大,磁盘的容量越人,恢复所需的时间就越长,重建一个lTB的磁盘需要l0一l2h的时间。SuzhenWu等人[114]提出了一种加速RAID恢复时间的算法。这种算法将所有待恢复磁盘上的用户写请求和部分热门的读请求临时衷定向到其他相对空闲的磁盘上,避免了在进行RAID恢复的同时读泻用户数据和恢复数据所造成的磁头来回跳转问题,平衡了系统负载,提高了恢复的性能。但是这种算法需要更多的磁盘空间,而且在集中恢复一块整盘时仍然需要相对较长的时间。而恢复时间越长,数据丢失的可能性就越高。因此RAID技术并不适合在大规模存储系统申用于保证高数据可靠性[115],需要进一步研究更加高效的可靠性保证机制。


由上述分析可知,设计一种新的适用于重复数据删除大规模存储系统的方法来保证数据可靠性是十分有必要的。


针对带重复数据删除的大规模归档存储系统的数据可靠性保证机制,从而提出R-ADMAD吧,它将去重生胰的变长数据块打包成定长的数据块,然后使用能够比简单复制机制提供更高的容错度的ECC编码来生成新的带纠错功能的数据块,再分布到根据各存储节点运行时的状态和出错的概率动态挑选出的存储节点冗余组中。这样,在部分存储节点发生错误时,R-ADMAD就可以在运行时分布式地恢复出错的数据。

保障带重复数据删除的存储系统可靠性方法

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)

相关推荐

  • 解析网络视频服务器的优势

    网络视频服务器内部主要包括三个模块:图像采集、图像压缩,网络传输。图像采集模块实现视频信号的A/D转换;图像压缩模块以某种压缩编码标准实现对数字信号的压缩编码;网络传输模块实现对压缩数据的传输和系统功能设置等功能。本文将主要讲述网络视频服务器的技术优势与应用优势。

    2026年4月10日
  • 云存储系统与传统存储系统的优势对比

    云存储系统与传统存储系统相比,具有如下不同:第一,从功能需求来看,云存储系统面向多种类型的网络在线存储服务,而传统存储系统则面向如高性能计算、事务处理等应用;第二,从性能需求来看,云存储服务首先需要考虑的是数据的安全、可靠、效率等指标,而且由于用户规模大、服务范围广、网络环境复杂多变等特点,实现高质量的云存储服务必将面临更大的技术挑战。

    2026年4月10日
  • 分析网络存储备份关键技术

    有效利用网络存储技术是任何数据存储管理策略的重要组成部分,仅仅依靠硬盘、JBOD和其它类型的本地存储是不足以保护关键业务数据的完整性的,网络存储在这个时候真正显示出巨大的威力,它不仅可以容纳由服务器产生的业务数据,还可以容纳由PC端产生的数据,并为数据提供良好的保护。

    2026年4月10日
  • 传统服务器在应用中连接存储方式的弊端

    高校在校园网建设中积累了大量的网络信息资源,这些信息资源以各自独立的服务器内置硬盘或直连存储(DAS)为存储空间存放,各个应用系统相互独立,属于典型的分散式架构。这种架构存在以下问题:1.存储空间不能满足数据增长的需求;2.数据分散管理导致投资成本增加;3.数据处理量增加导致系统和网络运行效率低下。

    2026年4月10日
  • 关于NAS存储应用在细节方面的技术分析

    NAS存储设备使用非常简单,通过数据网络直接向客户端提供文件共享。NAS从结构上可以分解为控制器部分、网络部分、存储设备三部分;存储设备可以是RAID磁盘阵列,或者是磁盘和磁带;网络部分从理论上可以是各种网络技术,支持多种网络拓扑;控制器部分从结构和功能上讲都是一个有自己的CPU和自己的OS的瘦服务器,NAS实际上是一个专用的网络文件服务器。

    2026年4月10日
  • NVRS优势明显 或将成为监控存储系统接班人

    回顾国内安防监控产品发展,CCTV模拟系统依旧占有较大的市场份额。为了改变人们传统的监控和存储模式,数字化的监控设备逐渐走俏。当越来越多的用户关注安防时,NVRS低成本高稳定性的特性满足了他们的需求。NVRS可以直接连接视频监控编解码器,实现监控数据的直接下载。本文将主要讲述NVRS的发展现状及趋势。

    2026年4月10日