1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。
如今,第三次浪潮终于到来,全球范围内的政府和企业正用不同的行动迎接这次数据革命。美国政府投资两亿美元,启动大数据计划,新加坡政府经济发展委员会资助成立德勤数据分析研究所,该研究所的目标就是引领政府和企业对于数据的研究和应用。
再来看一些企业的行动。通用电气投资15亿美元在旧金山湾区建立全球软件和分析中心,作为其全球研发机构的一部分,拟雇佣至少400名数据科学家。而国内领军的互联网企业阿里巴巴、百度、京东360都开始着手大数据的研究。
相对于全球的大数据市场,中国市场还处于起步阶段,总体来说比欧美国家滞后1到2年。
“不错,数据就是新的石油,面对大数据这个金矿,不仅仅是IBM、甲骨文等传统IT厂商在行动,电信设备商同样摩拳擦掌。中兴深谙数据市场多年,对这个市场也有着相当的信心。”中兴通讯大数据总工程师叶云在接受《通信产业报》(网)记者采访时表示。
思维的变革
叶云认为,在大数据的发展中,数据是源头和动力,大数据带来的不仅仅是数据量的变化,更是思维的变革。变革体现在三个方面:样本数据或局部数据向全体数据的变革;结果数据向过程数据的变革,静态存储数据向动态流处理数据的变革。
“只有从思维上适应了这三种变革,才能真正实现大数据的目标。”叶云说。
虽然企业已经投身到大数据这场革命中,不过确实也存在云计算初期的一些虚热现象。中国联通信息化部总经理柳博亮曾表示,不同厂商给我们传递的大数据概念都不相同,大数据到底是什么,我们无法确定,这是我们做大数据首先面临的一个挑战。他的观点代表了绝大多数试图淘金大数据的企业的担心。
对此,叶云解释,大数据是一个横跨多个IT边界的动态活动,所以目前并没有一个针对大数据的统一定义和标准。不过,业界对大数据所具备的4V特征已经达成共识。
首先是海量化(Volume)。IDC 2011年发布的Digital Universe Study报告显示,全球信息总量每过两年,就会增长一倍。仅在2011年,全球被创建和被复制的数据总量为1.8ZB。相较2010年同期上涨超过1ZB,到2020年这一数值将增长到35ZB。数据容量增长的速度正在超越摩尔定律。
其次是多样化(Variety)。Web1.0时代,企业数据以结构化数据为主,而现在进入Web2.0乃至Web3.0时代,非结构化数据已经占据绝对的主流。分析显示,结构化数据增长率为32%,而非结构化数据增长则翻了一番,达到63%,目前全球非结构化数据已占数据总量的80%以上。
第三是快速化(Velocity)。如今,企业面临的竞争环境越来越严峻,如果能够及时把握市场动态,并能快速制定出适当的运营策略,成为企业提高竞争力的关键。而反应在数据层面,则是数据的实时洞察。
第四为价值化(Value)。“如果大数据仅仅是停留在大量数据汇聚的层面的话,还不足以成气候。人们最终看重的,还是大数据进行分析和处理后,所带来的巨大经济价值。价值其实才是大数据的终极意义所在。”叶云向记者表示。