21世纪的IT应当从资源束缚中解放出来

亚马逊CTO Werner Vogels

数据中心、网络、存储器、数据库、负载均衡装置(Load Balance)以及包括其他计算机资源,所有的IT资源本来是可控制的,尽管如此,假如我们依然被旧的观念和习惯所左右而无法摆脱资源的束缚,是非常愚蠢的。21世纪的IT应当从资源中心(resources focus)向商务中心(.business focus)转移――。

以上是亚马逊的CTO Werner Vogels在11月29日召开的AWS re:Invent会议上所做的基调演讲开场白。通过云计算,AWS从根本上改变了IT世界。那么,AWS技术部门负责人Werner Vogels,他所描绘的“21世纪的IT”又将是怎样的呢?

21世纪的IT构架所必备的4大要素

Werner Vogels提出的21世纪IT不可或缺的4大要素

Werner Vogels认为,21世纪的IT构架需具备以下特点:

具有可控制性(Controllable);

灵活的故障修复功能(Resilient);

能够充分适应各种变化(Adaptive);

数据驱动(Data Driven)。

首先,所谓Controllable应为:

很小的各种组件是松散耦合(loose coupling) 结构;

App和process实现自动化;

持成本意识设计。

为了能够彻底实施自动化,资源就应当尽量保持松散耦合状态,由此,即使环境发生变化也能够实现灵活且迅速的最优化,与此同时,达到控制成本的目的。

关于这一点,Vogels强调,“希望用户不要试图在已有的IT基础设施上再追加物理资源”。他说,自从亚马逊在2010年11月10日,停止物理服务器运行后,就再也没有启动任何物理服务器。

他还说,所有的服务器都可以分割成小的软件零件,IT基础设施的肥大化必然招致成本上升,而随着商务的扩大,IT成本也随之上升的时代应当结束了。如果在IT构架时持有成本意识进行设计,必然将物理基础设施的扩大排除在外。

他接着说:“过去,我本人曾无数次“拥抱”服务器,但是,服务器是绝对不会“拥抱”你,它只会憎恶我们。”他反复强调物理服务器是不会自动靠近人的。

其次,对于故障修复,他重点强调:

应当最优先保护顾客的利益;

AZ(Availability Zone)最低要有两个 ;

开始时安全系统就应当和应用程序整合;

不要受个别故障影响,故障往往发生在没有准备的时候。

自然灾害会破坏数据中心,负载均衡设备(Load Balance )和路由器( router)会产生异常信息包(packet),有人会突然拔掉电缆,发生停电,服务器会崩溃(crash),光盘会突然停止运转等等,突然发生的故障任何人都无法控制。因此,就应当估计到发生故障的可能性,而发生问题时,首先要考虑尽力保护顾客的利益,采取适当的措施来防止问题发生。

Amazon S3运用三个AZ,不只是AZ内部,而且AZ之间也通过相互联系,保证99.99999999%的高可用性。

Vogels指出,故障就像部署(Deploy)一样,是能够事先设计的 。因此,重要的是将故障看做是必然条件,在进行系统设计时应考虑如何才能迅速修复故障的问题。

为了提高可用性就应当反复构建(build)、测试(test)、整合(integrate)和部署四个步骤。Amazon.com平均11.6秒实施部署,一小时最大能够重复1079次。同时,进行部署的主机(host)平均数为1万个,最多可达到3万个(Vogels)。

Amazon.com大约每10秒就进行部署。