保障带重复数据删除的存储系统可靠性方法

带重复数据删除的归档存储系统获得了更好的存储空间利用率是以降低数据可靠性为代价的,这在很多实际应用尤其是长期归档系统中是不可接受的。因此,在带重复数据删除的存储系统中,尤其在带重复数据删除的大规模归档存储系统中,如何保证数据可靠性是一个关键问题。Bhagwat,等人[100]首先注意到了这一问题,并初步定最分析了重复数据删除给存储系统可靠性所带来的后果。

总结起来,当前为带重复数据删除的存储系统提供可靠性主要有以下两类方法。


1.基干复制伪可靠性算法保证


Bhagwat等人[100]提出了一种根据数据块的重要性为其保存若干份副本的方法。这是一种自然、简单的想法,但它需要占用很大的存储空间,并且系统通信量也随着副本份数的增多而增大,这些特性抉定了其在大规模存储系统中的表现会比较低效[45],[112]。而且,Bhagwat的研究并没有考虑数据块的实际放置方法。Google公司的Googlefilesystem(GFS)[35]也采用了副本的方法来增强系统的可靠性。在GPS中,文件被分成固定大小的块,每个块由一个不变的、全局唯一的64位的chunk-handle标志。为了提高系统的可靠性,每一个数据块被复制成若干份存放在不同的服务器上。默认情况下,系统保存三个副本,但用户可以自己指定副本的数目。管理器在创建新块时考虑了数据块的分布,如优先放置在空间利用率低的磁盘上,同一份数据的副本放在不同的机器上等。


通过复制保证系统的可靠性是一种自然、简单的想法,但它需要占用的存储空间较大,并且系统通信量也随着副本份数的增多而增大,这在一定程度上限制了其在大规模存储系统中的使用。


2.基干RAID类系统的可靠性保证


直接使用RAID类(RAID-likesystem)系统作为底层的存储系统,这也是提高系统可靠性的一种常用方法。该方法对上层透明,容易实现和部署。但是传统RAID系统(RAID1-RAID5)的容错能力是极其有限的,无法容忍两块硬盘同时发生故障的情况。一旦存储系统中两块硬盘同时损坏,以往的RAID技术对此就无能为力了,这是对系统容错性要求很高的归档存储系统所不能容忍的。为了克服这一缺点,RAID6引入了双垂校验机制,通过使用基于Galoisfield算法或有限场的数学MDS代码,在驱动器上对数据进行编码校验,可以容忍任意两块磁盘的错误。J.s.plank[113]提出了一种易于转换成系统实现的RAID6编码。RAID6比RAID5具有更高的容错性,但也引入了更人的系统开销,复杂的校验计算使其较难扩展到大规模海量存储架构中使用。另外,类RAID系统只能进行整盘恢复,数据恢复时延相对较大,磁盘的容量越人,恢复所需的时间就越长,重建一个lTB的磁盘需要l0一l2h的时间。SuzhenWu等人[114]提出了一种加速RAID恢复时间的算法。这种算法将所有待恢复磁盘上的用户写请求和部分热门的读请求临时衷定向到其他相对空闲的磁盘上,避免了在进行RAID恢复的同时读泻用户数据和恢复数据所造成的磁头来回跳转问题,平衡了系统负载,提高了恢复的性能。但是这种算法需要更多的磁盘空间,而且在集中恢复一块整盘时仍然需要相对较长的时间。而恢复时间越长,数据丢失的可能性就越高。因此RAID技术并不适合在大规模存储系统申用于保证高数据可靠性[115],需要进一步研究更加高效的可靠性保证机制。


由上述分析可知,设计一种新的适用于重复数据删除大规模存储系统的方法来保证数据可靠性是十分有必要的。


针对带重复数据删除的大规模归档存储系统的数据可靠性保证机制,从而提出R-ADMAD吧,它将去重生胰的变长数据块打包成定长的数据块,然后使用能够比简单复制机制提供更高的容错度的ECC编码来生成新的带纠错功能的数据块,再分布到根据各存储节点运行时的状态和出错的概率动态挑选出的存储节点冗余组中。这样,在部分存储节点发生错误时,R-ADMAD就可以在运行时分布式地恢复出错的数据。

保障带重复数据删除的存储系统可靠性方法

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)
小安小安

相关推荐

  • 摄像头需要配硬盘机吗(摄像头需要电脑主机吗)

    摄像头需要配硬盘机吗? 摄像头是一种用于监控和录像的设备,而硬盘机则是用来存储录像数据的设备。很多人在购买摄像头时都会疑惑,摄像头是否需要配备硬盘机。在这篇文章中,我们将探讨这个问…

    2025年10月10日
  • 远程视频监控如何存储

    远程视频监控如何存储 远程视频监控是一种通过网络实时传输视频信号的监控系统,它可以帮助用户随时随地监控被监控区域的情况。在远程视频监控系统中,存储是一个重要的环节,它决定了监控数据…

    2025年10月9日
  • 硬盘 监控头 电视 如何组成监控

    硬盘、监控头和电视如何组成监控系统 硬盘的作用 硬盘是监控系统中的重要组成部分之一。它主要用于存储监控摄像头拍摄到的视频数据。硬盘的容量决定了可以存储的视频数据量的大小。通常,监控…

    2025年10月9日
  • 为AI和HPC蓄力,希捷推出基于Infiniband的混合存储解决方案

    希捷科技打造了基于英伟达高速Infiniband网络的混闪存储方案,为不同规模的AI计算集群提供高性价比的标准化存储。此混合存储方案的存储单元采用了内置NVMe固态硬盘和希捷机械硬盘高速存储相互配合的混闪模式,既能提供超高的性能,也能提供更佳的性价比

    2025年10月7日 资讯
  • 希捷×宇视科技:助力视频图像数据的安全存储与高效共享

    希捷科技携手宇视科技,为企业提供最先进的存储技术和服务、高效的数据传输能力,以及更加优质的存储解决方案,满足企业大规模数据存储的需求。希捷科技的产品技术实力和宇视云存储的安全性、高效性相结合,共同推动存储在视频联网中的应用。

    2025年10月4日
  • 安防摄像头的选型(安防摄像头排行)

    如何选择适合的安防摄像头 安防摄像头在如今的社会中扮演着重要的角色,无论是家庭安防还是商业安防,都离不开它们的监控和记录功能。然而,在市场上有各种各样的安防摄像头,如何选择适合自己…

    2025年10月4日