过去的几年里,有关于备份技术的话题始终聚焦在目标介质领域——磁带和磁盘之间的PK。这场竞争的结果似乎已见分晓,大多数用户和IT供应商更倾向于使用磁盘介质。因此,用户现在的关注点已经转移到了备份过程的前端环节,即数据的捕捉和传输。
据ESG调查统计,2004年之前约60%的受访企业直接将数据备份到磁带上,而没有使用过任何磁盘备份技术。但是到了2010年,这一比例下降到只有20%。在此期间,约有80%的受访机构告诉ESG他们在备份过程中使用了磁盘技术,该技术帮助他们缩小了备份窗口,也满足了更高的RTO(恢复时间点)指标要求。然而,数据量目前仍然在以指数级的速度不断增长,这也意味着对备份系统的要求会越来越高,备份的流程也需要更新。其结果促进了CDP技术、复制技术、源端重复数据删除技术以及快照技术的广泛应用。ESG研究发现,这些技术的使用情况有不同程度的明显增长:在从2008到2010年,快照的应用增加了2%,复制增长了34%,CDP增长了58%,而同样在这两年之内,重复数据删除的应用则大幅提高了66%。
快照和镜像备份
在什么样的情况下,我们能压缩备份窗口,加速系统恢复,并且达成高效的容灾呢?高效率,那是基于快照和镜像备份的最大特点。快照是卷或者文件系统在指定时间点创建的拷贝,利用快照的功能优势做数据备份,能够极其明显的降低备份过程对应用系统的影响。快照备份可以压缩备份窗口,提供秒级或分钟级的RTO指标,通过每天更多频次的快照,还可以获得更好的RPO指标。
镜像备份也可以利用快照技术,为系统数据创建一个指定时间点的完整拷贝。系统数据可以是硬件配置信息、操作系统、应用程序或业务数据等等。镜像是一个独立的可移动的文件。基于时间点的快照备份属于热备份,所以关键的应用系统在备份过程中不需要中断。快照备份极大地削减了备份窗口,并且能够快速进行系统的整体恢复,恢复的目标可以是虚拟机或物理机,也可以恢复到异构的硬件平台。快照和镜像备份在数据的捕捉、传输和存储环节的效率都非常高,最初需要做一次完整的数据初始化拷贝,之后进行的数据捕捉和存储则都是针对增量数据块。
CDP
CDP技术的原理是连续捕获变化中的数据。它可以基于文件、也可以在数据块层或者在应用层,支持细粒度水平的数据捕获和精度恢复选项。CDP引擎会给每个写操作都打上时间戳标记,然后将这些经过处理的写操作镜像保存到一个记录日志中,从而连续跟踪数据的变化。当需要做数据回滚时,CDP引擎会根据我们指定的时间点,为产生卷创建一个在该时间点的映像卷,而这个过程不会影响到生产应用程序的运行。
块级CDP在逻辑卷层进行操作,记录每一个写操作。这种类型的CDP技术的突出特点在于透明捕捉数据,而且能够形成任意时间点的数据视图。通常,CDP引擎与被保护的应用程序在同一台服务器上运行。文件级CDP在文件系统层面进行操作,可以记录文件系统上发生的任何改变。应用感知型CDP则能够在CDP数据流中跟踪关键应用程序的检查点信息,有了这些信息之后,数据的回滚恢复会变得异常简单。比如跟踪数据库的交易一致性检查点,或是Email等应用程序的一致性检查点。
CDP连续数据保护技术完全摒弃了离散的备份形式,代之以透明的、连续数据采集过程,生产服务器只需要很低的备份开销。此外,应用数据一旦产生就立即被CDP捕获,因此基于CDP的备份解决方案可以恢复最新产生的数据,RPO指标接近为零。
复制
复制技术是所有这些备份策略的基石,目前也越来越多地被用于数据保护。复制是一个独立的进程,可以保护应用程序,提供可操作的灾难恢复能力,且具有最佳的RPO和RTO指标。作为一种为文件级集中备份而整合分散数据的技术,复制可以同快照或者CDP结合使用,维护一份远程的数据备份,从而实现容灾应用。通过复制技术,我们可以在本地或远程维护一份精确的数据镜像,发生灾难时,复制卷能够快速挂载到主机恢复生产数据。在数据初始化拷贝结束之后,通过块级增量复制以及网络压缩过程,存储的容量和带宽都可以得到优化。
在主机层、存储层和网络层都可以实现数据复制。通常,磁盘阵列和网络层产品使用的都是基于块的复制技术,而主机层复制主要在文件系统层。主机层大多提供异步复制,而磁盘阵列和网络层则通过配置,可选异步或同步复制。同步复制的原理是,只要生产系统发生数据写操作,这些操作都会实时复制到目标系统。异步复制则是一种准实时的操作,只有当数据在生产系统上写完之后,才会复制到目标系统。