云宕机战略:构建冗余

云服务并不完美。甚至像亚马逊Web服务这样的领导者都经历了各种宕机事件。好消息在于使用云计算,你同样可以以某种途径保护自己的服务远离云服务提供商宕机的影响,这种方法可能不适用于传统的服务器托管。要记住在你的云计算宕机战略中最重要的就是冗余。

除了传统备份之外,对云宕机最有利的防卫就是计划冗余。想法非常简单:如果一个服务器宕掉,其他服务器来接管,终端用户甚至都不会注意到这个问题。

实现冗余的技术有很多。选择之一就是把你的服务器放到朵个数据中心中。亚马逊Web服务(AWS)为例,让你来选择可以把服务器托管在哪里。在这个案例中,可以把一个服务器放到弗吉尼亚的数据中心,将冗余服务器放在俄勒冈的数据中心。如果你的服务提供商不提供多种数据中心,你应该在其他厂商中分布冗余,一些服务器放在AWS上运行,一些放在Rackspace上。

下一步,准备一个管理系统和合适的基础架构,以便冗余能够真正的在宕机事件中运作。

像VMware的vCloud Director、Microsoft的System Center以及BMC的Cloud Lifecycle Management都可以持续监控服务器。如果一个服务器宕机了,可以将其从活跃服务器集中取出,直到你找到备份。为了实现这项工作,你需要配置你的域名系统(DNS)服务器,以便当一个客户端,比如一个浏览器,为一个URL寻IP,其地址能够返回到寻址的那一个服务器。这样就能够将客户同活跃服务器;连接,跳过宕机服务器。

大型企业很可能已经使用DNS配置,但是更小的公司并没有使用复杂管理软件,但仍有办法实现容易。让第二服务器准备运作,但是关掉。一些云厂商对于关掉的服务器不收费。在宕机事件中,启动冗余服务器,直接到你的DNS管理器,并转换IP地址指向新的服务器。效果可能不是立刻的,但是通过现在的DNS服务器,应该可以快速工作。DNS管理器可以在变更发生前24小发出警报,但是在实际中,通常是15分钟。要指出的是:如果你维护的传统服务器断电了,你要确保用最新版本软件定期升级。

提前采取正确的措施和计划协助企业能够更好的应对云宕机。如果宕机发生了,终端用户只会经历短时间宕机或者根本就不会体验到。