基于云计算的数据中心建设及反思云计算技术目前已成为包治百病的灵丹妙药,无论何种解决方案最终一定会归结为云计算。在云计算的浪潮下,高校数据中心是否应该部署云计算?如何才能使云计算切实的落地,真正发挥效益,而不仅是一个概念,也是一个值得深思的问题。
虚拟化技术在数据中心的实践
大连理工大学校从2003年开始对校内各个部门对外信息发布的服务器进行统一管理,开始建立集中的数据中心。数据中心的建设经过了两个阶段:第一阶段采用独立的1U物理服务器来提供服务,最多的时有200多台物理服务器。在这种模式下,应用的备份管理、物理服务器的故障处理,机房面积、供电、制冷的消耗等问题都集中爆发出来。从2006年开始,学校开始进行服务器虚拟化技术的相关测试,并在2007年建设了高校第一个大规模VMware虚拟化服务器群;从第二个阶段开始,把原有物理服务器上的应用逐步迁移到虚拟化服务器上,现在已有280余台虚拟机在运行。2009年对虚拟化服务器群进一步扩容,2010年对第一批虚拟化服务器进行了内存和万兆网卡升级,并部署了数据中心交换机CiscoNexus7018。目前数据中心已经部署了16台54CPU虚拟化服务器群,所有物理服务器采用双10GbE网卡、双4GbFCHBA上联,物理服务器群保持了合理的负载。
在服务器虚拟化实施的过程中,发现物理服务器的内存消耗速度要远高于CPU消耗速度,因此在服务器群扩容时,新增服务器内存提升到了144GB,原有服务器内存也扩充到了64GB。另一个影响服务器虚拟化效率的重要因素是存储系统的性能。为进一步提高存储系统性能,在2011年,我们对现有存储系统EMCCX4-960进行了FastCache技术升级,采用多块100GB固态盘对整个系统进行读写缓存,使存储读写延时得到了显著改善。
在虚拟化平台安全方面,设计了严格权限管理和备份制度。例如,资源管理部门只拥有在自己资源池内分配虚拟机及配置指定网络的权利;备份由后台统一进行,资源管理部门无法删除备份等。在备份体系上,采用EMCAvamar进行统一的全局减重备份,可以提供任何一台虚拟机在半年内任意一周的备份。对于关键服务器,同时使用VMwareDataRecovery进行日备份;对于关键应用再使用磁带库进行应用级备份。通过严格的管理措施和多级自动化备份机制,有效的保证了数据中心的安全。
配合内部机构设置规划了合理的管理结构,将广义的基础设施(包括网络、存储、虚拟化平台、备份、机房环境等)整合统一到一个部门管理,其他部门变成该部门的用户。实践证明,这种模式有效的提高了资源的利用率,提高了管理效率,初步形成了部门内部基础设施云服务提供。
在虚拟化平台实施的过程中,数据中心的运行和管理成本大大降低,数据中心的物理服务器已经从200余台减少了近一半。管理部门进行应用升级、迁移成本显著下降。通过模版、快照等机制,管理部门可以轻松的部署应用,在应用升级失败时可以进行完整的回退。
如何让云计算在数据中心落地
在数据中心虚拟化的实施过程中,充分证明了服务器虚拟化在高校数据中心的可行性和必要性,并也实现了实际的效益。那么云计算和虚拟化又是什么关系?可以将高校云计算和虚拟化的关系简单总结为以下几点:云计算的目标是实现应用的按需使用,虚拟化只提供了资源池化的一种手段。只能够自动化,提供大量虚拟机不是云计算。云计算的核心问题不是资源的池化,而是应用是否能够真正无缝地按需扩展。
因此,我们认为影响高校数据中心云计算实施的关键因素是信息化相关应用是否真正的面向云计算开发,能够真正的以云计算模式提供服务。服务器虚拟化或基础设置虚拟化只是向云计算演进的第一步。高校云计算部署应该是一个渐进的过程,随着对云计算的认识和应用的开发,逐步演变为云计算。大连理工大学的云计算演进过程定位如下:
在建设面向云计算的数据中心过程中,中国高校刚刚迈出了第一步。
传统的应用架构并没有考虑动态扩展的问题。例如在选课的高峰期间,我们希望将一台选课应用服务器自动动态扩展至适应请求数的数量,并在高峰期过后自动降回通常的数量。现在我们通过采用服务器虚拟化和应用服务器集群,可以部分解决这个问题,但目前这个过程并不是自动化的,仍然需要人工配置和干预。在应用压力进一步提升后,传统的应用服务器、中间件、数据库架构,并不能保证真正的动态扩展。
在PaaS阶段,我们希望能够探索新的应用架构,在消息通讯机制、数据访问机制、自动扩展机制等方面,实现真正面向云计算的开发平台。在这个基础上,校内新开发的应用逐步迁移到云计算平台,实现应用的按需使用。
在云计算背景下,我们认为除了适应云计算的应用架构模式外,数据中心当前的关键技术还包括:
1.支持数据网络和通信网络融合的网络设备
当前万兆端口的成本大幅下降,板载万兆(LOM)会逐步取代板载千兆。主流板载LOM已经开始同时支持FCoE、iSCSI卸载和IP传输。主流存储厂商已经开始在中高端存储上直接支持FCoE。高端数据中心交换机已经开始支持DCB(DataCenterBridge)等规范,可以提供二层多链路、无丢包以太网等关键特性。因此,全面实施数据网络、通信网络融合的时机已经成熟。
2.支持FCoE、分层存储的集中存储设备
从我们目前运行和测试经验看,FC协议仍然是高可靠的数据中心存储局域网的唯一选择。支持FCoE的交换机、CAN接口卡已经非常成熟,存储设备也已经直接支持FCoE接口。用FCoE替代传统FC的技术风险相对较小,仍然可以延用传统FC的运维经验,在技术上保持连续性。大规模的虚拟化实施中必然存在热点数据和非活动数据。固态盘价格相对较高,完全采用固态盘在成本上难以接受。存储设备需能够动态区分热点数据,将热点数据自动迁移到固态盘或者较高性能盘,将非活动数据迁移至低成本硬盘,从而能够用合理的成本提供高性能服务。
3.网络、安全设备的软件化、虚拟化
在大规模的虚拟化部署中,传统的物理网络、安全设备已经不适用。传统的安全设备无法部署在虚拟机之间进行安全控制。我们认为基于软件的虚拟设备将取代部分物理安全设备。例如,在Host和VM之间的防病毒网关、控制VM之间安全策略的分布式软件交换机、纯软件的Web应用防护设备、纯软件的防火墙设备。
4.通信网络和虚拟化基础设施的融合
传统的通信网络控制是基于三层路由控制或者二层的接入端口控制,在虚拟化基础设施中已经不适用,虚拟机会在二层端口上迁移,同宿主机上的虚拟机之间的访问不经过物理交换机。在虚拟化环境下,物理交换机应能感知到虚拟机的迁移,并动态调整控制策略。物理交换机应能同虚拟化交换机一体化管理,将虚拟交换机作为物理交换机的延伸。
综上所述,高校数据中心部署云计算技术的背景已经成熟,通过云计算技术的部署能够有效降低数据中心运行管理成本。但是如何能够使云计算技术真正全面地落地,仍然是一个需要研究的课题。我们希望能够通过面向云计算的应用开发平台的研究和部署,作为信息化应用全面云化的一个契机。建设面向云计算的数据中心还存在一些关键的技术问题,我们将在未来的数据中心建设中,将这些关键技术作为重点考虑对象