数据分析技术与商业智能的发展使得CIO们能以较低成本、快速而深入地处理商业数据。
近期,趋势中心调查显示,CIO们对商业分析的关注度并不低于如何利用新商机的力度。例如,随着越来越多公司不得不面对海量数据,如何利用这些数据也被提上了日程。大型数据集管理与分析等技术的出现,能够提前帮助公司分析成本与发展趋势,提供更有用的信息以帮助公司运营业务,这意味着公司能够发现比以前更深层次的问题。
在采访中,CIO们总结出了五点影响他们进行商业分析的IT趋势,分别为:大数据增长、数据快速处理技术、IT商品的成本下降、移动设备的普及和社交媒体的增长。
第一,大数据。
大数据指非常庞大的数据集,尤其是那些没有被组织、管理起来,不适于传统数据仓库的数据集。比如:网络蜘蛛数据、社交媒体反馈和服务器日志,以及来自供应链、行业、周边环境与监视传感器的数据等,这些数据致使公司的商业分析变得比以往更加复杂。
尽管并不是每个公司都需要处理大型、非结构型的数据集。但是,Verisk Analytics公司CIO Perry Rotella认为所有公司的CIO都应当关注大数据的分析工具。Verisk帮助金融公司评估风险,与保险公司共同防范保险诈骗,2010年的营收超过了10亿美元。
Rotella的工作是预先寻找数据间的联系与模型。他认为,技术领导者对于数据大幅度的增长,应该持乐观、欢迎的态度。
HMS公司CIO Cynthia Nustad认为,大数据呈现为一种“爆炸性”增长趋势。HMS公司的业务包括帮助联邦医疗保险(Medicare)和医疗补助(Medicaid)项目控制成本及私有云服务。其客户包括40多个州的健康与服务项目和130多个医疗补助管理计划。HMS通过阻止错误支付在2010年帮助其客户挽回了18亿美元的损失,节约了数十亿美元。Nustad称:“我们正在收集并追踪大量素材,包括结构性与非结构性数据,因为你并不知道你将在其中寻找到什么。”
关于大数据谈论最多的一项技术是Hadoop。该技术为开源分布式数据处理平台,最初是为网络搜索索引等任务开发的。Hadoop为多个“非关系型(NoSQL)”技术(其包括CouchDB 和 MongoDB)中的一种,其通过特殊的方式组织网络级数据。
Hadoop可将数据的子集合分配给成百上千台服务器处理,而主作业调度程序将整理每台服务器汇报的结果,因此其具有处理拍字节级数据的能力。Hadoop既能够用于分析前的数据准备,也能够作为一种分析工具。此外,没有数千台空闲服务器的公司,也可以从亚马逊等云厂商那里购买Hadoop的按需服务。
Nustad称,尽管并不是为了其大型的联邦医疗保险和医疗补助索赔建立的数据库,但是HMS正在探索NoSQL技术的使用。其包括结构性数据,并且能够被传统的数据仓库技术所处理。她称,经过实践证明最好用的解决方案,如果从传统关系型数据库管理层面出发并不明智。不过,Nustad认为Hadoop在防止欺诈与浪费分析上发挥着重要作用,并具备能够分析各种格式的病历方面的潜力。
在采访中,那些体验过Hadoop的CIO们,包括Rotella和Shopzilla 公司CIO Jody Mulkey在内,都将数据服务作为公司业务的参考重点。
Mulkey称:“我们正在使用Hadoop,代替以往数据仓库的工作。更重要的是,我们获得了以前未有的切实有用的分析技术。”例如,作为一家商务网站,Shopzilla每天会积累大量的数据。他称:“以前,我们必须要对数据进行采样并对数据进行归类。在处理海量数据时,这一工作非常繁重。”自从采用了Hadoop,Shopzilla能够分析原始数据,跳过许多中间环节。
Good Samaritan医院是一家位于印第安纳州西南的社区医院,其数据处于另一种类型。该医院的CIO Chuck Christian称:“我们并没有我认为属于大数据的东西。”尽管如此,管理中规定要求其整合庞大的电子医疗记录,存储为全新的数据类型。他称,这无疑要求他们实现从数据中收集医疗保健信息。不过,这可能将在地区或国家层次的医疗保健协会中实现,而不是在他们这种单个医院中实现。因此,Christian未必会对这种新技术进行投资。
Island>