在虚拟化环境中实施重复数据删除技术

  答:当你在任何环境下,需要对基于客户端的环境进行备份的时候,往往会遇到大量数据备份的问题,在使用了重复数据删除技术后,备份窗口将不再是问题。另外一个在虚拟化环境下部署重复数据删除技术时需要考虑的问题就是大量的I/O请求都会被发送到同一个硬件设备上。用户随时可能在一台服务器上出现故障。然后用户需要做的仅仅是将数据流从去重目的端与源端备份数据剥离,再恢复回来即可。

  “去重技术在帮助用户解决容量问题方面能起到很大的作用,然而,在恢复的过程中却不是唯一的方法或者出路。”

  去重技术在帮助用户解决容量问题有着很大的帮助,然而却不是数据恢复时的好帮手。因为用户往往会对去重资源池有着大量的读操作。此外,恢复操作中往往会在许多不同的线程中产生不同磁盘上的操作。比如说,可能在一块硬件背后放置着20个或者40个的虚拟机,那么最后的结果很可能就是不能在相应的窗口完成恢复的操作。因为,我们通常建议客户使用多种不同的数据恢复方案来应对“丢失虚拟机”的情况。并且建议使用更多的主要数据保护措施,而并不是仅仅依赖于对备份的信任,可以尝试考虑使用快照的方式来节约数据恢复的时间。我相信没有人会希望保留30天的备份,但一定要确保能在遇到虚拟机损坏或者错误的更新后能有一个良好的回滚点。具体需要看遇到的情况是哪一种,相信没人会希望恢复的时间要将所有的数据都从备份数据库中拿出来,即使这对系统容量很有帮助。

  问:去年,VMware公司发布了针对数据保护使用的vStorage API接口以及作为整个vSphere架构一部分的其他API接口。据您所了解,在当前的重复数据删除市场上,有没有什么产品使用这些API接口?

  答:对于虚拟化环境来说,vStorage API的推出对该环境下的备份的帮助是显而易见的。在此之前,我们曾遇到过许多的麻烦,而现在一切都变得不一样了。虽说vStorage API有着适合所有类型环境的接口, 然而我觉得它在源端去重的使用上意义更为重大。vStorage API中最新颖的就是使用了变更数据块追踪(change block tracking, CBT),在此项功能的帮助下,用户能够知道在不同快照之间有哪些变化。之后,发明者就想到了在虚拟机环境中部署代理来实现虚拟机的备份。用户可以结合一些源端的技术再使用代理,从而实现在完成快照后能在虚拟机内部实现重复数据删除技术。值得注意的是,此项技术去重的部分仅仅是对最近一次快照之后产生变更的数据块。

  一些有关vStorage API的技术着重于降低数据从虚拟化环境中导出的时间。现在,用户可以清晰地意识到在给定的时间点到现在,虚拟机上作出了哪些改动,此外,也可以将源端重复数据删除技术和主要的虚拟化环境的数据保护技术结合起来从而达到最佳结合。之前在代理的设置和使用上遇到的问题是,那时几乎在这个方面没有什么可以解决的方法。简而言之,用户先使用快照,然后用代理在即使有瓶颈的情况下将数据从虚拟化环境中剥离出来。

  用户可以选择使用源端去重技术,不过在虚拟机环境下使用许多不同的运行方式。现在用户可以考虑使用vStorage API接口了。你可以通过使用快照技术再加上源端的去重技术快速地在虚拟机内部将重复数据剥离出来,还可以使用更为优化的源端去重技术,在代理的帮助下将快照挂载起来,然后对其进行去重再备份。vStorage API接口能够实现不同环境下的去重,并且能够将重复数据删除技术和虚拟化系统结合起来在其内部实现去重。如果用户感兴趣,还可以向厂商咨询一些市场上潜在的针对这些情况的解决方案,从而了解市场上的一些方法是如何通过在他们的产品中部署vStorage API接口来加速其虚拟机环境下的备份或者去重过程的。