当今世界,存储成为一个热门词汇,数据量的几何级的增长给存储带来了压力的同时也带来机遇,使得存储领域得到快速发展。据IDC报告称,2006年全世界的产生的数据量是1610亿GB,如果按现在个人PC 120GB标准配置的话,需要13亿多台,也就是整个中国人口人手一台电脑,才能存得下这么多的数据。至2010年,这个数字将猛增到6倍,达9880亿GB,年复合增长率为57%。
数据猛增,带动了存储行业的快速发展,各种存储技术也开始大行其道,而做为存储中的备份也越来越受到重视。虽然单位存储空到间的价格越来越低,带宽也是从Kb,Mb,Gb不断升级,但是数据的增长的抵消了的价格的优势,而带宽的增加同是也带来了成本的增加。数据的无用冗余加重了存储及管理的负担,对企业的资源带来无谓占用。所以在对数据进行备份存储时减少数据的冗余,减少对带宽及其他资源的占用,不但可以压缩成本,同时也对数据的管理起到正面的作用。
而合成备份正是在这样的一种召唤中,走向台前。
所谓的合成备份,通过由将已经备份的数据合成而来生成的备份。是将之前的完全备份与其后的增量备份进行组合而生成的。这里的增量备份只包前一次备份后变动的信息。合成备份的使用是基于某个时机,或者在系统不需要完全备份的情况下才会执行。
合成备份的提出将可以产生以下的效益:
1. 由于合成备份的数据不从数据源取得数据,只从原来备份的数据中提取,从而可以极大地减少备份所需要的时间,进而提高备份的速度。一次完全备份,将会消耗大量的CPU 及带宽资源(涉及到网络数据传输)。合成隐含的备份好处就是永远是增量备份,相对完全备份,由于数据量的减少,备份所需要的CPU及其他的资源就会减少。
2. 由于采用合成备份,不需要对同一份数据进行多次保存,相应地就减少了数据增长带来的管理与存储空间压力,进而提高效率,减少存储成本。前面也提到过,由于数据增长带来的成本负担已超过存储空间单位成本的下降的好处,所以,减少冗余数据依然是减少成本的有效方法。如在文件级的备份方式下,有一个完全备份的文件
合成备份更节省空间
对于恢复,合成备份也有其独到的好处。普通备份当恢复文件时,需要参考到多个不同的时间点的备份,然后再恢复还原成需要的文件,这必将带来性能的损耗。而合成备份只需要参考一个时间点的备份,所以恢复时的时间成本也相应地得到压缩。
传统的增量备份与合成备份的比较:
合成备份在不同的产品中的实现是有差异的,并且各有侧重点,有的关注空间、有的关注带宽。有的产品是实现以块级为基础的。通过索引值来实现逻辑上的合成备份。这样的合成对于用户来来是透明的,在用户的观点来看,如果要恢复这个合成备份,也只需要参考到这个单一的备份数据。其次有文件级的合成备份。通过对完全备份与其下的各个增量备份的分析,最后生成一个真正的合生备份,并将各个增量备份及完全备份中冗余的数据删除来清除冗余信息,减少存储空间的消耗。
在对备份数据进行合成时还需要考虑的几个因素,一是执行的时机,二是执行的地点。由于合成操作可能会需要较多的计算及IO,所以合成的时机不能在业务繁忙的时候执行。在这种情况下可以通过类似于循环或者定时执行的策略来解决执行时机的问题,使合成操作不致会影响到正常的业务。其次就是执行地点应该在介质服务器端,这样可以减少对于带宽的占用。比如爱数备份软件网络版的合成备份的执行在介质服务器,并且通过循环备份策略自动触发,以辅助用户简化对于备份数据的管理,并且不会对用户的网络造成影响。
当然合成备份并不是可以应用到任何需求环境中,考虑一个方案各个因素时,只有当在空间与带宽是最大权值时(比如在备份时用户只需要保留最近的备份,在恢复时也只是需要恢复到最近的状态)合成备份才是一个可以加以选择的方案。在考虑在布署一个备份方案时,需要根据自己的实际情况,选择合适的产品。同时还要考虑产品的一些性能参数(如增量备份限制)、备份策略等是否满足自己的需求。
这个是好东西啊