VMware Infrastructure 3 是适合 x86 平台的一种最为先进和常用的企业服务器虚拟化系统。当企业更深地认识服务器虚拟化以及虚拟化带来的种种可能后,他们开始研究向另一虚拟服务器复制的方式,相比使用传统单独物理服务器进行灾难恢复和确保高可用性,这种替代方案更为简便且成本更低。虚拟化实现的可移动能力消除了硬件兼容性问题,大大简化了所复制虚拟机的恢复。
但是,虚拟机至虚拟机 (V2V) 的灾难恢复仍存在复杂性。在恢复站点协调存储卷与虚拟机之间的关联是一项非常复杂且很容易出错的人工任务。而且,简单复制虚拟服务器仅提供“崩溃一致性”磁盘映像,与系统突然发生断电时的映像类似。执行快照和复制包含多个虚拟磁盘的 LUN 时,若不清楚这些磁盘所支持的操作系统和应用程序且得不到其协作,可能导致文件系统不一致以及数据库和其他应用程序中丧失应用完整性。这使得恢复工作非常困难而艰巨,因为系统管理员必须执行一致性检查,有时甚至要重构整个系统。
为简化这一流程,VMware 推出了VMware 站点恢复管理器 (SRM),这是一种适用于VMware基础结构的灾难恢复管理和自动化解决方案。VMware SRM能简化和自动执行恢复流程,在各站点间维持虚拟机与存储之间的协调。
虚拟基础架构与灾难恢复挑战
尽管VMware SRM消除了 V2V 灾难恢复的管理难题,仍然有一些重要的数据一致性问题亟待解决。实现 VMware Infrastructure 3 的许多出色功能需要一个共享存储基础结构,通常是SAN。在一个或多个联网的存储阵列上整合虚拟服务器能将包含虚拟服务器的LUN复制到远程站点的虚拟基础结构,从而简化灾难恢复并降低灾难恢复成本,实现业务连续性。
在图 1 中,复制到DR站点的虚拟服务器磁盘处于崩溃一致性状态。服务器很有可能启动;但是由于没有在应用程序停顿(即无数据写入磁盘的状态)或文件系统缓存刷新的情况下执行了快照,文件系统和应用程序可能损坏。要将这些服务器恢复为运行状态,通常需要进行文件系统和数据库一致性检查,导入事务日志,有些情况下还需要重构应用程序。
为确保使用复制对虚拟机进行的灾难恢复一致可行,企业必须采取一种方法来协调与存储复制并发的所有应用程序和文件系统的停顿。
可以为单个物理服务器上阵列与支持的应用程序之间的协调编写脚本,但这不是一项普通或简单的工作。操作系统中的复制代理可简化这一工作;但是,大多数阵列复制代理都无法感知虚拟。在多台虚拟服务器共享一个或多个 LUN 的虚拟环境中,情况则更为复杂。协调所有虚拟机及其应用程序与快照流程并发的停顿比较困难,并可能导致应用程序停机,因为磁盘 I/O 需暂停以等待受影响的虚拟机完成复制或重新应用恢复日志。
如果在具有多种潜在磁盘配置的情况下,企业选择集成系统和应用程序以停顿应用程序并刷新文件系统缓存,则需要一个全面的系统来管理虚拟机的协调和复制,以扩展 VMware 技术的内置功能。为满足这些需求,飞康针对虚拟基础结构开发了一个简化、整合的 DR 自动化解决方案。
飞康解决方案
FalconStor Application Snapshot Director (ASD) for VMware 能协调飞康NSS设备与虚拟机上的应用感知的飞康快照代理,以提供一种集成的解决方案,用于向远程站点进行不间断复制,并保证完整的事务与文件系统完整性。
可以为多种虚拟基础结构存储配置进行复制配置。为便于管理,可以将多个虚拟机归入一个虚拟文件系统。要执行文件系统的快照,必须先停顿每个虚拟机,然后执行虚拟文件系统所在的基础磁盘的快照。
对于 I/O 性能至关重要的虚拟机,可以使用物理兼容性模式的 VMware ESX 裸磁盘映射 (RDM) 并将其映射至 VMware ESX Server 3.5 控制台以及直接映射至客户操作系统,以此构建理想配置。通过物理兼容性,RDM 能确保客户操作系统能以几乎与物理服务器完全相同的方式配置和复制。
在这种配置下,飞康NSS可以通知虚拟机中的快照代理停顿应用程序并刷新文件系统缓存转入RDM磁盘,以便作好快照准备,从而确保文件系统一致性。然后再将快照复制到另一台远程飞康NSS设备,提供已知良好的时间点上环境的事务一致性映像。