IaaS和DevOps成为IT运维管理的新常态

运维1

在过去十年里,云计算从一个概念迅速发展成为一个大家普遍接受、并广泛应用于实际生产中的新型IT基础设施。尤其是在公有云IaaS领域,以AWS、阿里云为代表的厂商取得了令人瞩目的成就。如此同时,和云计算几乎同步发展起来的DevOps理念也随着云计算的普及而逐步被人们接受,并成为主流的软件生产方式。

根据Puppet Labs 2014年度调查报表显示,目前有超过半数的受访者已经在实践DevOps。并且该调查报告还显示采用DevOps软件生产方式是企业打造出高效IT服务能力的有利武器,而一个高效的IT服务能力能够把软件和服务部署的频率提升30倍、同时降低50%的失败率。因此,我们认为企业IT领域正处在重要的变革器,即:IaaS和DevOps已经变成企业IT领域的新常态。随着IaaS及DevOps成为新常态,企业IT系统的运维管理体系也需要做出明显变革,以适应新常态的需求。

一、新常态下的IT运维管理变化

从IT系统进入企业起至今已经有几十年的发展历史。在这个过程中,IT运维管理也逐步成熟起来,并形成了以ITIL为代表的完整运维管理体系。 ITIL以传统IT服务为管理目标,提出了一整套从系统设计、实现到运维的完整流程。这个体系强调流程与规范,以对内输出服务为主要目标。但是,现如今的企业IT服务已经不再仅仅是企业内部的业务支撑系统,而是需要直接面对最终用户,快速响应市场变化,并已经成为企业核心竞争能力之一。这些新情况对以 ITIL为核心的传统运维管理体系提出了迫切的变革需求。而 IaaS 和 DevOps 成为新常态后,这种变革需求则变得更为直接和具体。

变化一:IaaS成为新常态后,企业的运维管理重心转到应用运维

在IaaS出现之前,企业的IT运维管理职责一般包括基础运维和应用运维。这种职责划分甚至都能直接映射到很多企业内部运维团队的组织架构上。很多公司的运维团队就会分成以基础运维为主要职责的基础运维团队,以应用运维为主要职责的应用运维团队,部分公司还会有支撑如上两个团队的运维开发团队。但是,IaaS成为新常态后,企业的基础设施已经变成IaaS平台,其基础运维工作已经完全由IaaS平台供应商负责。而最终企业用户则只需要关注应用运维层面的工作。这会导致很多以基础运维为核心和出发点的工具(如传统ITOM管理软件)及其实践方式都不再适用。当然,采纳IaaS后,整个运维管理团队必须要有自己的云平台策略,并为之配套相应的运维管理工具,以充分发挥IaaS平台的优势,做好应用运维这个重心工作。

变化二:DevOps成为新常态后,企业的运维管理目标转为持续交付

在传统软件生产方式中,Dev和Ops两个团队相对独立,甚至因为组织结构上的原因形成了隔阂。这种情况对于给最终用户交付IT系统价值非常不利, 并经常导致整个运维管理流程以控制变更为目标而忽视交付给最终用户的价值要求。DevOps则强调让Dev和Ops相互融合,并以最大化交付价值为最根本的追求。这种思想下的一个重要原则就是持续交付、快速迭代。为执行这个原则,自服务IT、自动化一切、持续部署等最佳实践被广泛采纳。同时,IaaS平台提供的“可编程”基础设施让这些最佳实践更容易得以实施并极大推进了DevOps软件生产方式的落地。

二、Iaas和DevOps成为新常态下的企业IT运维管理面临的问题

在IaaS和DevOps成为新常态之后,企业的IT运维管理同样会面临着一些新问题。具体总结为如下几个方面。

问题一:IaaS成为新常态后,如何统一管理不同云平台的资源

当企业决定采纳云平台作为其IT基础设施,就需要面对统一管理不同类型基础设施的问题。部分基础设施为公有云平台资源,部分则可能来自遗留的企业内部虚拟环境或者物理机。即使无遗留IT基础设施,企业也经常选择多家公有云平台来避免被一家供应商锁定。另外,出于业务安全或者合规要求,企业非常有可能采用混合云架构。下图来自RightScale 2015年企业采用云计算平台现状的调查报告,其调查结果也佐证了这个观点。

运维2