EMC销售部全球CTO:大数据不是炒作

现在,大数据这个话题甚至比云计算还要火。EMC公司副总裁、销售部全球首席技术官Patricia Florissi博士认为:“目前,我们对于大数据能够带给人们什么样的利益,能够在多大程度上影响人们的生活和工作还没有一个深刻的认识。现在,我去亚马逊网站买书,绝不会只买一本书,而会根据网站的推荐信息,购买其他一些我感兴趣的东西。这就是大数据时代给人们生活带来的新变化。”

大数据需求真实存在

大数据是一场变革,它不仅影响了人们的生活、工作,更重要的是影响了人们思考问题的方式。很多人认为,大数据的主要作用就是帮助厂商更准确地了解消费者的消费行为,比如买了某个品牌手机的用户通常会再购买另一个品牌的衣服。其实,大数据的功用远不止这些,大数据将在很大程度上影响人们的决策和行为模式。

Patricia Florissi告诉记者:“通过与客户的交流我们发现,很多客户现在并不明白大数据到底能给他们带来什么样的价值。但是不管客户现在是不是理解大数据的内涵,绝大多数的客户面对大数据不会袖手旁观。许多企业内部至少会有一个部门或一个人在做与大数据相关的事。”

云计算刚兴起的时候,很多人热衷于讨论云计算是不是一种具有变革性的创新技术,是“新瓶装新酒”还是“新瓶装旧酒”。大数据是不是也存在类似的问题呢?云计算改变的是IT的消费模式,大数据则改变了我们工作、生活和思考问题的方式。Patricia Florissi认为,大数据不仅仅是数据量大,而是代表了三个新的趋势:第一,海量数据改变了人们看待事物、看待数据的角度;第二,因为有了云计算,人们有能力部署更大规模的存储,具有更强的处理海量数据的能力;第三,人们已经具备了一定的知识和技术水平,可以进行大数据分析。

Patricia Florissi举了印刷机的例子。印刷机是15世纪发明的,但是印刷机的大量商业化应用却发生在其后几百年。印刷机刚出现时,虽然有能力快速印制出很多书,但那时会读书、写字的人并不多。随着人类文明的进步,人们掌握了更多文化知识以后,印刷机才真正有了用武之地。大数据处理和分析也会经历这样一个发展过程。大数据出现后,如果人们没有足够的存储空间和存储能力,那么就只能把大量的数据删除;如果人们有了足够的存储能力,但是没有分析数据的能力,那么大数据也没有价值可言,就像面对大量的金矿石,却无法从其中提炼出金子一样;如果有了存储能力和数据分析能力,但人们本身不具备解读数据的能力,那么也无法挖掘出数据的价值。“现在,我们已经拥有了存储能力、数据分析能力和数据解读能力,因此大数据应用对我们来说并不是虚幻的,而是真实存在的。”Patricia Florissi表示。

实时处理能力更重要

很多人一谈到大数据,首先会想到非结构化数据的处理。IDC的统计数据表明,非结构化数据已经占数据总量的80%~90%。因此,处理多样化的数据成了许多用户关注的焦点。但是有的存储厂商认为,再过一段时间,用户就不会再关心数据到底是结构化的还是非结构化的,因为数据实时处理才是大数据处理的关键。

Patricia Florissi认为,用户对数据实时处理的需求正变得越来越迫切。人们对数据实时分析的关注度已经超越了对数据本身准确性的关注度,这正是数据量激增带来的变化。“如果用户只拥有少量数据或数据样本,那么数据的准确性对于用户来说是非常重要的;如果用户面对的是海量数据,那么数据的准确性就不再那么重要,因为大量的数据可以弥补数据准确性的不足。”Patricia Florissi表示,“数据的价值是有时间性的。比如,我今天拿到了一张商场的优惠券,明天就可以用这张优惠券去买一条裙子,而几周或几个月以后,没人会再理会这些信息。”

EMC现在就拥有这样的技术和能力,可以找到非结构化数据中的一些结构化特征,这样就可以把针对结构化数据的某些分析方法和分析技巧用于处理和管理非结构化的数据。

存储可变形

在即将举行的EMC World大会上,EMC将发布其“软件定义存储”(SDS)的新产品。不过,在新产品正式发布之前,Patricia Florissi拒绝向记者透露产品的技术细节。

Patricia Florissi认为,SDS将颠覆现有的存储市场,软件定义网络(SDN)将颠覆现有的网络世界,软件定义数据中心(SDDC)将颠覆现有的数据中心市场。这些变革将汇集成一股强大的力量,颠覆整个IT市场。