我们如何理解大数据?大家一提到大数据都会想TB级的数钻,或者是结构化半结构化的数据。其实我们这个行业考虑大数据的时候主要是考虑处理大数据的工具。比如说关系型数据库,但是我们发现关系型数据库有一些传统的处理根本不能适应大数据的需要。大数据不仅关乎于数据,也不关乎处理的工具,大数据它含有的商业价值比一般的数据大很多。世界上任何国家地区都认识到了数据能变现能产生很多业务模式。
从另一个角度探讨这个问题,比如说英特尔的Hadoop这方面非常先进,尤其我们在中国市场地位非常稳固。以前我们是一个芯片公司,现在我们开始关注Hadoop以及一些软件。我们发现通过Hadoop和软件的结合可以更好的利用大数据所带来的商业机会。几年以前我们跟中国合作伙伴的合作模式跟现在不一样了,这是因为创新引起的。之前跟中国合作会发现中国移动每年会产生很多数据量,而且数据量提升了30倍,对于一些运营商来讲,如果你提交的查询需要30秒的时间你是接受不了的,1秒还可以,现在大数据能够使得这些公司更接近于他们的用户并且为用户提供更好的服务。
大数据在智慧城市领域也有很大的影响。中国正在快速的发展中,智慧城市利用一些图像的控制和监控的视频来提升交通流量、提升交通的顺畅度,比如重庆就利用了监控数据的数据提升公共安全或者交通的便利性。在北京或者其它地方跟很多年前相比是有很大的不同的,如果有智慧城市项目在这儿进行的话,我相信大家上二环、三环肯定不会像现在这么沮丧了。
大数据很有作为的地方就是医疗健康领域。比如得癌症的人,我的一个同事很多年前得了肾癌,当时用的是传统的治疗癌症的药品,但是当时我的同事利用大数据破解癌症基因组的秘密。他觉得这个结果看起来更像是胰腺癌,后来将治来药物做了调整,过了几个月他就得到了一个很好的治疗,并且延长了他的寿命。如果我们能够把这个做成大众都能用得起的服务的话,那么是令人激动的,比如基因的破解、以及治疗各种疾病过程中,这是我对大数据的期待。
Hadoop不可能解决所有大数据的问题
英特尔的目标:大约几年前从谷歌一直到雅虎,Hadoop成为了一个开源性的大数据应用工具。Hadoop不可能解决所有大数据的问题,Hadoop本身也不是一个所谓的解决方案。但是我们相信,Hadoop这个框架它是一个非常基础的框架,能够使得数据的各种结构应用放在Hadoop的基础之上。在传统的产业当中,很多人如果能用到Hadoop更简化的架构的话,能够给他们工作带来很大的帮助,我们相信Hadoop有非常大的潜力,使它更容易部署,成本更低。并且也能用到更广泛的应用领域当中。
因此我们在各个领域当中对Hadoop进行改进。比方说实时的分析更灵活。当今的Hadoop是一种批处理工具,只能提供有限的价值。但是我们现在要把它打造成下一个平台的话它能有更广泛的应用和更大的能力。
现在大数据面临什么样的问题?比方说安全、实时响应、环境的负载度、实现业务价值途径等等。很多公司一开始都是考虑要存储什么样的数据以及可以从这些数据分析当中得到什么样的价值?这是大部分公司所想的问题。这些先进的公司确实是在考虑价值模式的创新。但是大部分的公司还是在考虑到底该怎么办?原因之一是因为复杂度,因为有很多工具出现需要人们学会相应的技术掌控它们。我们从数据当中得到的一些分析,如果能够实时一点的话才会起到真正的作用。我们要解决这些问题,如果采用高度集成或者垂直基站方式来做的话,可能对于很多用户来说是可以的。但是英特尔认为,开放性能够使得我们在长期内获得更快、更大的增长。对于高度集成或者私有的封闭方案可能能很快的解决问题,但是长期来说对于大数据更长期的价值实现是不利的。
如果我们有一个开放性的可操作的基础或者框架,当然是以Hadoop为基础,但是要超越这个基础才能够实现开放环境下的各种服务和应用实现,为整个行业带来利益。