避免大数据的管理风险的第一要务,并非是技术或产品上的实施与部署,最重要的,是企业策略与CIO理念上的转变:大数据首先不是机遇而是挑战,首先需要着手解决的不是数据分析、利用,而是将数据更好的存储与管理起来,这才是大数据时代企业CIO首先要做的事情。
当然,纠正概念并非意味着我们没有更有效的手段和方案却解决大数据的管理风险。从数量上来看,大数据的"可怕"之处首先就在于它的"大",也就是数据的规模化效应,以现有的手动的、人工的方式自然是不能够很好应对的,因此,重要的是要有高度自动化的解决方案来应对。
高度自动化的方案并不仅仅是将企业的数据存储策略自动化、数字化,而是要求能够将各种存储设备(包括存储的数据类型)统一的、自动化的管理,通过自动化的、可靠的策略执行减少人员的工作量,而自动化的监控和报告、预警能够警示所有的不合规或备份恢复等策略无法得到正确执行的情况。显而易见的是,自动化的管理能够在一定程度上降低采购成本和TCO.
我们注意到,市场上很多的产品都开始在简化管理界面,加强自动化与智能策略管理上下功夫,无论是IBM如今正当主流的StorWize V7000还是EMC去年推出的VNX,管理界面和自动化程度都非常之高,以V7000为例,其脱胎于IBM高端存储XIV的管理界面简洁有效,即便SAN中有多台异构存储,当V7000虚拟化整个SAN环境下的磁盘阵列后,绝大部分管理工作只需集中在V7000上统一执行。从而简化管理,降低因为专业管理人员有限所带来的管理风险。
除了自动化之外,纵观如今的中端存储市场,位居前几位的供应商的中端存储几乎都是统一存储当道。IBM的StorWize V7000自然不用赘述,是业内中端存储向文件数据+块数据的统一存储转变非常快和非常成功的例子,EMC的VNX和入门级的VNXe也提供统一存储平台,戴尔拥有基于EqualLogic平台的FS7500和入门级的NS3500,NetApp则彻彻底底是以NAS平台为基础的中端存储自然不用再赘述了。
我们看到在大数据的非结构化数据不断激增的趋势下,中端存储相比高端存储更容易将块数据和文件数据整合在一个统一存储平台中,而这些系统为了将企业原有的块数据与文件数据以及不同的存储系统进行整合,统一存储同时还多是"虚拟存储":V7000可以虚拟化SAN环境下所有异构磁盘阵列,形成一个融合的、统一的存储池。数据可以跨不同阵列透明地存储、转移,因此整个SAN下的资源可以被充分调动起来,迅速解决任何一个空间或性能问题,从而大大降低因为存储环境复杂所带来的管理风险。
自动化、块数据与文件数据的统一存储、虚拟化带来的存储系统整合,这些方法都能够有效降低数据存储尤其是大数据存储的风险。