云计算咨询公司HyperStratus的CEO伯纳德•戈登(Bernard Golden)撰文称,云计算最迷人的方面之一是许多(如果不是多数的话)有关云计算的讨论都把重点放在云计算如果影响基础设施方面。简言之,多数人都花时间思考他们的云应该以什么管理程序为基础,应该用什么样的服务器托管他们的云,用什么存储设备支持其虚拟机,等等。
毫无疑问,云计算是基础设施的一个巨大改变。但是,这种改变方式忽略了这样一个事实:云计算是由一个与自动化操作结合在一起的灵活的基础设施组成的。如果你安装了云计算而没有实施自动化,你的革命仅完成了一半。这个革命的下一半是把自动化引进到日常运营中并且保证一个公司的云可提供随选即用的资源访问、应用程序伸缩性和弹性以及根据需要提供的一个通用的资源池。
实施一个云环境意味着资源消费者和资源提供者必须在一个服务界面上交流。服务界面是能够调用的一套自动化的服务,不需要人类的干预:没有电话、没有申请标签、没有会议。
换句话说,一家公司要成为一个云提供商必须包括所有这些功能。
观察公共云提供商提供什么和如何运营具有指导意义,可作为云服务提供商CIO(首席信息官)的一个样板。一个云服务提供商运营需要什么核心竞争优势?
首先,有一些基本的竞争优势:
消费者自助服务。NIST(美国国家标准及技术研究所)云计算定义的第一个要素是:IT资源的消费者必须能够自助服务,不需要与资源申请方的另一个人互动。要实现这个目标,需使用某种类型的网站界面,这种网站界面一般带有预装资源的服务目录。这肯定不是向服务台发出一封电子邮件要求代表申请者创建一个虚拟机。
从具体基础设施中提取的应用。云服务提供商提供计算能力,而不是具体的硬件资源。换句话说,通过自助服务提供的虚拟机可以在云基础设施中到处迁移,并不承诺这个虚拟机将位于某个具体的硬件中。在最近出版的图书“Visible Ops, Private Cloud”(可见运行,私有云)中,作者把这种虚拟机迁移称作“提起和转移”。
基础设施投资与应用分开。许多CIO都玩这样的游戏:设法通过把基础设施投资与具体应用计划捆绑在一起获得必要的基础设施投资。作为云服务提供商,这意味着拥有一个通用的资源池。应用程序可以使用这个资源池,但是并不与这个资源池捆绑在一起。因此,用于基础设施的拨款必须与应用程序计划分开处理。在某种程度上,这只是记账的区别。然而,在投资基础设施的机构中,这不是一件需要优先做的事情。把这个事情与应用捆绑在一起是使这项投资成为可能的唯一途径。人们可以预计文化和机构改变是必要的。除此之外,人们会注意到整个基础设施开支水平可能会显著提高。虽然每一次平台转变(例如从大型机转变到微机)都会导致人们预计整个IT开支会减少,但是,事实上,降低成本总是导致应用的大幅度增长以及整个IT开支的增长。云计算也不例外。
除了上述基本的情况之外,这对于承担云服务提供商的责任意味着什么?对于一个IT机构来说,下一组含义具有更大的革命性和挑战性,搞错了将导致计划失败和被迫转移到外部云提供商。
以高度变化的工作量和资源使用支持应用程序。传统的应用程序资源消耗非常稳定的,但是,新一类应用程序有更高标准的工作量偏差。例如,你创建一个Facebook应用程序。当人们“赞”你的网页的时候,这个应用程序向人们提供一个注册你的产品的免费样本的机会。这将导致一个用户账户的创建以及订单输入。一位Twitter名人用微博介绍你的产品,在24小时后会出现成千上万的粉丝。两天之后,关注程度下降到每天几百个粉丝。你的云必须能够在这两种极端的工作负荷情况下很好地托管这个应用程序,也就是在工作量很大的时候能够提供充分的资源,在需求减少不再需要这些资源的时候撤销这些资源。
自动运行。上述资源风暴与正常的上班时间不一致;那个名人也许在世界的另一边发表博客。当工作量冲击一家提供商的基础设施时,资源必须能够分配到一个应用程序,不需要人的干预或者不需要任何人做任何人工工作。换句话说,操作这个云必须是预先设置好的。这样,资源就能够通过自动化规则自动增加或者减少。作为一个云服务提供商,工作人员应该设计这个系统。这个系统应该管理单个的资源申请。需要人类干预来改变应用程序资源分配或者结构等于承认失败。
容量规划。这个问题在以前的博客中已经解决。但是,这个问题很重要,需要重申一下。作为一个云服务提供商,资源需求的可见性是有限的并且持续时间很短。然而,这个服务界面暗示一项承诺:接到申请之后,资源将随时提供。当然,一个政策可以是固定的(像亚马逊做的那样),把申请限制在固定数量的服务器。然而,如果一个应用程序像上述的Facebook应用那样工作量波动幅度很大,必须要使这个政策允许有例外的情况。更重要的是必须有足够的可用容量以满足应用程序工作量需要的水平。
高使用率。许多演示断言,使用私有云比从公共云服务提供商那里获得的服务要便宜。这个观点有很大争议。许多人对这两方面都发表了重要的意见。戈登称,在他看过的所有演示中,利用率达到70%以上的推测增强了私有云更便宜的理由。因为云服务提供商同任何资本密集型零售企业(如航空公司)一样,如果利用率达不到必须的工作负荷,经济就会变坏。过去,服务器利用率的责任主要由应用部门负责:如果他们过多配置,预计结果是很遗憾的和糟糕的。如果你运行私有云并且明确承诺比公共云更节省成本,能够突然达到高利用率是非常重要的。考虑到上述应用程序工作量稳定性的变化性质,这个任务将变得更有挑战性。亚马逊使用聪明的激励措施(如,现场实例定价)提高工作量负荷低的时候的资源利用率。类似这种事情对于云服务提供商的CIO来说也许是必要的。
所有这些要素可以归结为一件事:像一个云服务提供商那样运营需要像一个企业那样而不是像一个成本中心那样做事。只有认识到作为一个云服务提供商要把基础设施的灵活性与运营能力结合起来,私有云的美景才能成熟。以前的每一代技术升级都推动同样的运营方式的发展:聪明的人们人工安装和配置硬件的每一个部分。“机架和堆叠”这个词汇完美地诠释了这些做法。云计算是需要伴随技术升级的第二代运营升级。