大数据:CIO必须掌握的5个须知

IDG News Service纽约分社Joab Jackson

开始于部分web服务商所进行的分析大数据的浪潮正在波及到一般企业。这是因为,即使目前条件还不完善,但是为了保持竞争力并维持正常的营业状态,要充分利用大数据。在此情况下,下面本文将介绍企业的情报最高负责人所要必须掌握的有关大数据的5项内容。

▲画面1:Hortonworks Web <http://hortonworks.com/>)

第一,形势要求企业,抓紧掌握好大数据。

分析大数据,最初是由google、雅虎及twitter等美国的web服务供应商开始做起来。这是因为上述这些企业有必要最大限度地利用来自用户的信息资源。但是,从目前趋势看,我们认为,即便是一般企业也为了保持竞争力并使企业运营正常进行,将来有一天就要把大数据很好地利用起来。

在美国GigaOM调研主管Jo Maitland 指出美国目前有些企业尽管其企业规模小,但它却拥有大量的数据,比如对冲基金公司就拥有大量的数据。另外,美国的咨询公司McKinsey and Company最近预测,认为再过几年,包括公共机构、健康管理、零售业、制造商圈在内的广泛的各业界通过对大数据进行分析,将会获取相应的财务利润。

提供HadoopLinux发行版的美国雅虎Hortonworks最高技術責任者(CTO)Eric Baldeschwieler也说,目前正在形成一种高潮,要认识到掌握大数据乃是企业的必备项目。这种趋势具有普遍意义,它适用于诸多领域的顾客。这是因为,收集交易信息并对它进行分析,将会使企业更深入地了解顾客的消费趋势走向。因为这些数据除了可以运用于新产品开发和新型服务外,也对用最快的速度来解决今后可能发生的问题,提供方便。 

第二,对企业有用的信息和数据,普遍存在于任何事物中。

可能有的人觉得,目前手头里还没有一个最重要的可参考的大量数据;但是,我们可以说,你就可以掌握这些数据的日子很快就会到来。上述Baldeschwieler指出,你所要的大数据,其实不过是通过“收集各处分散的数据而形成”。

比如说,server上的计算机操作日志文件夹(log file)可能就是大数据。Server就会告诉每个人他所要查阅的不同领域的不同部门的内容。通过跟踪这些数据即可知道顾客究竟需要什么。分析操作日志这件事本身虽然很早就有,但是,在新形势下,它将在更高的水平上进行分析,其分析精密度将会进一步得到提高。

与此同时,取自于传感器上的数据也将会成为大数据。最近几年来,有些证券分析师也早已开始谈论那些廉价的感应器如何同网络连接起来,连续发出数据信息,以便了解“物”的流通和消耗过程,即“物”的网络化现象。现在,我们就可以设想一下,这些数据可以来自于车辆、桥梁以及饮料的自动售货机所提供的信息。 美国微软Kevin Dallas指出,IT行业设备的真正价值在于,使它收集数据并对所收集的信息进行分析,以便提高商业效率。