从早期简单的单机管理,到如今的企业云的管理和运维,在不经意间IT运维管理已经在发展中从一棵幼苗孕育成了一棵充满生机的苍松翠柏。
纵观整个IT管理的发展历程,IT运维经历了一次又一次的变革,而这每一次变革,都为IT运维带来了不同层面和不同角度的思考方向。而当前随着企业数据中心集约化趋势的发展,IT运维迎来了新的变革,而这些变革使得企业信息化管理人员不得不进行更深层次的思考。
IT运维的变革
在这场变革中,最容易令人发现的是基础平台的变化,而在基础平台的变化中,最核心的是虚拟机和虚拟网络的应用普及。
虽然虚拟化技术为企业信息化建设带来了大量的成本节约和应用便利,但是对于IT运维管理而言,针对虚拟化技术的运维管理工作无疑意味着IT管理演变进程中的一次重大变革。虚拟化的实施,使得的原本想对固化的网络基础架构变得灵活多变,对于虚拟服务器、虚拟网络的运维管理使得传统的人工运维、传统的运维系统力不从心。
同时,高度集约的数据中心虽然节约了企业分散在各地的计算成本,但是企业的核心数据中心却变得更加的复杂和庞大。无论是服务器等计算资源还是交换机等网络资源,它们的节点数量、相互之间的关联程度都变得更加的繁杂。这些资源对于IT运维人员来讲,是一些分散的资源,如果采用传统的方式进行运维管理,往往造成顾此失彼的现象。
此外,私有云的落地使得企业的信息化管理者需要将底层的IT基础平台与上层的应用系统进行联动管理,这样才能真正构建起信息化对于实际业务的支持模型,为将来的信息化升级工作做好基础。
变革带来的思考
当变革产生的时候,如果不能主动应对变革,必然会产生失衡,失衡的后果就是信息化建设的坍塌。科技的发展带来了新的IT运维需求,相关服务提供商需要做的事情是找到应对需求变化的理论方法和技术手段。而用户的信息化管理者需要做的则是找到合理的解决方案并且快速的部署实施。
实际上,无论用户还是IT运维服务提供商,他们所探求的核心目的是一致的,那就是将分散的IT资源进行统一的融合管理。不同的是IT运维服务提供商是解决问题的技术提供者,用户是解决问题的方案使用者。
对于统一的融合管理,需要融合哪些方面?通过什么样的手段进行统一管理?对于这些问题,H3C的iMC2.0数据中心管理解决方案提出了很好的参考意见。
想要做到统一融合管理,需要解决的问题可以分成四个方向:
一、融合的基础设施管理;
二、智能的自动化管理;
三、完善的安全管控策略;
四、开放的IT管理架构。
融合的基础设施管理包括:
1、 统一网络管理平台。通过统一的网络管理平台将海量的网络和服务器节点进行实时的监控,通过有效的阀值设定,实现准确的故障以及与故障报警以及准确定位。
2、 虚拟网络管理。将虚拟网络与物理拓扑图进行结合,动态显示虚拟网络、虚拟机的变化迁移,将原本比较抽象的虚拟机和虚拟网络进行实体化管理,帮助用户解决虚拟化的管理瓶颈。
3、 服务器应用管理。针对计算核心的实施监控,针对服务器本身硬件配置以及相关操作系统、虚拟化系统进行监控管理,确保业务计算核心稳定运行。
4、 业务流量分析。针对网络流量以及相关数据包进行分析,一方面保证相关业务的带宽稳定,同时衡量出不同业务对于信息化资源的需求,另一方面,对网络流量的分析也可以杜绝安全隐患。
智能的自动化管理应该具有的特性包括:
1、虚拟资源自动迁移。
服务器虚拟化为保障VM系统的可靠性、灵活性,提供了VM迁移、以及高可用性(HA)、热备容错(FT)、动态资源池调度(DRS)等特性,这些特性都会影响VM的物理部署位置,而VM接入物理网络设备是需要一定的网络资源配置的,其接入位置的动态性就要求物理网络配置能提供随需而动的管理能力,否则VM对网络的连通性、安全性、可靠性需求就无法得到保障。
为了实现网络配置的动态迁移、随需而动,准确定位VM和物理交换机的连接关系是关键能力。正在形成标准的802.1Qbg协议不仅保证了所有网络流量都必须在物理交换机上处理,而且通过EDCP/CDCP/VDP等协议解决了VM和交换机连接关系的定位需求。
另一方面物理交换机端口和VM的1:N连接关系,使针对每个VM的网络配置实现精细化控制是非常复杂的,H3C实现的802.1Qbg方案通过在物理交换机上支持vPort概念,为解决该问题提供了更好的支持。
iMC基于802.1Qbg实现了虚拟化环境中网络配置的自动迁移能力。同时基于iMC对于网络和服务器、VM的融合拓扑分析能力,支持vSwitch环境下的网络配置自动迁移能力。
首先根据用户应用对网络资源的需求,定义网络资源类型。然后将此网络资源类型分配给不同的VM,则VM在迁移或启动时,就会在网络设备中自动分配相应的网络资源。
2、数据中心设备“零配置”。
这里所说的“零配置”是相关设备与IT运维系统之间的配置关系。对于企业用户而言,内部的信息化设备的品牌繁多,相关设备的更新换代也比较频繁。如果运维系统需要针对每一台设备进行配置备案的话,工作量浩大而繁琐。
而iMC的“零配置”指的是IT运维系统对于相关设备的自动识别,相关监控数据的自动采集和抓取,这样既节约了运维系统的上线时间,又降低了管理者的工作成本。
3、网络服务自动编排。
在云时代的数据中心环境中,我们所面临的不再是一成不变的设备环境,基础设施可能随着业务需求的变换而不断增长、调整。为了屏蔽不同厂商、不同型号设备的差异,使IT管理员聚焦在服务本身,必须要作到对资源及业务的快速开通,实现高度智能的自动化管理。iMC借助融合的资源管理能力,将各种资源提供的能力抽象出来,建立统一的机制,实现基于业务的编排能力。
4、IT服务水平自动度量。
根据ITIL(信息技术基础架构库)规范要求,数据中心IT服务部门通过服务水平管理(SLA)来保证其服务有效,建立服务健康水平监督体系,来保证服务达到规定的健康水平等级,即使服务失败,也可以正确分析原因,帮助IT服务部门做出正确的应对决策。
完善的安全管控策略所需要的要素包括:
1、配置合规检查
数据中心规模庞大,设备及系统众多,管理人员经常面临的问题就是大量重复设备配置的规范性、安全性问题。伴随着各种审计体系在级别和频度上的不断增加,传统的通过人工方式检查设备规范性的审计方法,不仅效率低下,还会存在遗漏,已经无法适应云时代数据中心的安全管控需求。都说安全问题“三分技术,七分管理”,但是想要把那“七分管理”iMC配置合规检查内置常用的策略,如NSA路由安全建议、PCI、Syslog功能、设备安全高级建议等,以满足用户的日常检查管理。
用户可以自定义合规策略,对网络设备进行配置检查。合规策略包括一个或多个检查规则,一个检查规则分为配置文件、接口、链路、聚合链路、配置片段、脚本等不同类型,包含支持的厂商、设备系列、检查内容来源、规则内容等信息。
用户可通过创建检查任务来检查设备是否符合合规策略,检查任务包含待检查的合规策略、设备的信息等。检查任务执行完毕后,可以通过报表查看设备违背合规的信息。对于违背合规的设备,用户可以创建违规修复任务进行修复,及时解决在数据中心环境中出现的配置问题,提高安全等级及各种法案法规的遵从度。
2、设备操作审计
设备资源是数据中心的基础资源,对于设备管理的安全性也是信息安全的重要组成部分。与配置合规检查不同的是,iMC设备操作审计从验证管理员登陆设备的身份、权限出发,根据企业设定的规则,合理分配访问设备的权限,即明确管理用户可访问的设备,可执行的命令,可完成的操作并记录设备管理员详细的操作行为信息,以利于以后历史回溯和故障的判断和分析。
iMC设备操作审计通过TACACS+协议实现,提供基于接入情境的控制策略,统一的监控设备管理员的登录和执行命令行操作,支持主流厂商的设备,简化操作员为设备管理员细化权限的过程,为管理带来了便捷。
开放的IT管理架构的特点:
云计算最终的目标是达到系统的按需运营,运营系统能够根据用户请求执行服务的开通。任何一套管理系统,都不可能满足所有用户的需求,在云时代尤其如此,这就要求用户在建设数据中心时具备开放的管理战略,IT管理系统具备开放的能力。iMC是一个开放架构的SOA平台,所有iMC相关产品都是在此统一平台上开发的,并在此平台上封装网络服务并开放服务接口,第三方产品可以使用基于iMC 平台和开放的API接口实现对网络资源的调度。
总结:
随着IT运维需求的改变,用户需要及时调整和升级IT运维管理的方式,同时找到适合自身的解决方案。