微软王枫:云计算与大数据时代下的新世界

随着大数据的趋势和大数据的现状,确实也给企业带来了很多问题,包括一些挑战,大数据在那里,我也知道它的价值,那么我怎么去通过大数据来发掘出它对我企业能够制定更好的方针和政策,如何去更好的处理实时的数据,通过我刚才讲的产业链,采集、存储、处理、分析各个方面,最后如何通过更好的工具去分析,我把这些数据可视化。这些都是摆在企业面前的一个挑战和创新。

大数据确实是给企业、给世界、给IT,包括政府在内,提供了很多的机遇。其中之一,就是对于企业的决策,任何一个企业的决策,他通过什么去保证他能够制定更好的方针和政策,我想这个东西不能只是拍拍脑袋,要根据一些真凭实据,现在有这么好的数据资源,怎么更好的利用,这是很重要的。大家可以看到,将近50%以上,现在在世界的各个企业的领导者都知道怎么去应用大数据来做企业规划和战略的制定。同时,大数据是一个产业链,这个产业链不光是虚拟的概念,它同时也带动了不光是在软件上,IT的服务、软件的开发,包括硬件,我刚才讲了,大数据离不开硬件的基础、计算、存储,也带动了整个IT的商业发展。

刚才讲了一些概念,接下来我会从大数据的生命周期,我们微软认为最主要的三个阶段,来给大家做一些具体的介绍。这三个生命周期,第一,首先你要把这些数据采集起来,通过什么样的方式。第二,这些数据要存储,以什么样的存储技术,能够保证它的安全性,它的不间断性、可持续性、扩展性。在这个基础上,当你也了数据以后,如何去把这些数据做处理,去丰富、去满足你企业所想要的要求。最后,如何在这个基础上,通过你已经处理好的、已经整合的、已经清理干净的数据,来在上面做分析,来做格式化的展现。所以,这三个我想对于实现大数据的价值是非常非常重要的环节。

说到存储,大数据对存储的要求是非常非常高的,我想从简单的技术层面来说,你能够存多大的数据量,你数据的安全性、不可间断性、可持久性、扩展性,是这些数据存储的基本技术。从另一点来说,大家又会面临一个问题,也就是说现在大家说到云计算,一般来说,在一个IT的应用里,在数据存储这块无非有几种方式,一种是传统IT的方式,也就是说每一个企业邮自己的数据中心,这个数据中心既可以是传统的物理机的模式,没有采用云计算的技术,也可以是一个私有云,同时像徐博士也讲了,微软有自己的公有云,不光是微软,还有业界的其他公司也有公有云的这种模式,我也可以通过公有云来存储管理我的数据。这里面有什么区别呢?我想给大家总结一下,比较大的区别,因为刚才徐博士也不断强调安全,我想对于公有云的模式,实际上安全包括网络上的速度可能是一个比起私有云和你自己的数据中心来讲,是一个你需要考虑的因素。因为你一旦放在公有云上,你一旦开放了,你一旦通过很多的网络,通过外网就会很必然的,特别是数据量很大,像大数据这么大的数据量,各种各样复杂的数据,虽然能够帮你节省管理和运营的成本,你不需要自己管理运营数据中心,但是也有它的弊病。从另一点来说,如果是你企业自己内部的一个内网监控下的私有云,或者传统的数据中心来说,你可以通过你自己的控制,来保证它的安全,来提高你的效率,特别是数据中心的效率。

从这个角度来说,混合云,在一种混合的模式下可能是一种最好的方式。也就是说对于大数据的处理,你可以根据企业的业务特性,来制定哪些应用、哪些数据需要通过私有云的方式,哪些需要放在公有云上,来利用公有云的优势,这样对于企业来说,最后是以私有云的方式来管理存储大数据。

从存储的角度,我想再回到核心的技术,最主要的有两点,第一,关系型的数据中心,第二,非关系型数据中心。比如说微软SQLServer已经不简简单单针对结构化的数据,各种各样的数据类型,SQLServer都有这个能力去处理存储,甚至可以自定义自己的数据类型,有些数据类型可以通过它提供的技术自定义,同时因为它是关系型数据库,对于刚才我讲的大数据、复杂的数据,可以利用各种各样的技术进行查询、索引,比如刚才讲的全文本的查询、非结构化的属性的查询,都可以通过它提供的各种各样的技术来管理、存储,来更好的利用这些数据。