阿里巴巴集团CTO王坚:互联网、数据和计算

  由此可见,数据这件事情是跟基础设施与生俱来的,只不过互联网这个基础设施从第一天的设计开始,使得它沉淀数据的速度、方法、价值都远远超过了传统的任何基础设施,这是它非常不一样的地方。设想一下,如果每个脚印都被留下来,都能数字化,都像今天鼠标点击那么容易处理的话,今天互联网公司做的所有事情都可以做到,只不过并没有因此产生巨大的价值而已。

  另外,我听不得的一句话,就是“数据是搜集起来的”,我一直坚持“数据是被沉淀下来的”。当一个数据被人搜集时,它的价值也就被搜集数据人的目的给束缚住了。过去,预测谁会成为美国总统,到街上进行问卷调查,基本上就能八九不离十。但今天是如何知晓的?将所有的聊天数据处理一遍即可。它们之间的差别是什么?差别就在于有一天存在其他需求时,不需要再去做问卷调查,而可以将Twitter数据处理一遍。因为你不知道这个数据是干什么的,使得这个数据的价值被大大增加。互联网让大家对数据的认识远远超出过去,原因是什么?就是不明不白的数据被留下来。

  很多人跟我说阿里巴巴数据很有值钱,我听着就很郁闷,为什么郁闷?当你知道一个数据值钱的时候,这个数据就不值钱了。数据的魅力在于,你不知道今天它能干什么,明天它就帮你很多,这是数据非常有意思的地方。这是互联网进步带来的,今天所有的技术进步带来的。

  我们讲数据是最不值钱的,值钱都是信息,还有一个东西更值钱,是智慧。为什么数据这件事情在这个时代变得重要,是因为所有人过去以为找到金子就会发财,但到了互联网时代,实际上找到沙子是让你发财。在互联网时代不是去找金矿,而是找到把沙子变成金子的方法,这是真正的价值。

  如果假定互联网是基础设施的话,数据就是个新的生产资料,它的价值与土地一样,没有办法直接判定它是否存在价值,直到有人去开荒、盖房子。数据其实就是如此,它对社会的价值远远超出过去。当然,这个 生产资料跟所有生产资料有不一样的地方,用户需要用自己的方法找寻到它的价值。

  三、关于计算:新型公共服务

  计算为什么很重要?这么多年有个感受,特别是在过去五六年讲云计算的时候,我觉得云讲得太多了,而计算讲少了。我认为云只不过是计算的一种方法,真正产生社会价值的是计算。刚才我分享数据是没有价值的,直到有一天被计算时才会发挥价值,所以可见,计算在此之中起着非常核心的作用。

  以Google为例,它将 世界上每个人到今天为止都可以拥有的数据作为最重要的生产资料。到今天为止,这个财富不单属于哪一个人,而是在座每个人的,它只不过是每个人都有的数据积累。而Google的优势在于它有足够便宜和多的计算能力,使得它开始做“搜索”,其实就是这么简单,这也是我们可以认真反思的高性能计算所在。

  倒过来讲,谷歌靠什么地方挣钱?大家都说是广告,我则不以为然。当有PC开始,有个东西叫鼠标,当时我在微软做一个项目,今天说“Big Data”,那时候还不知道此为何意。以前的软件公司与今天物联网硬件公司一样,卖出十几亿份的Windows、Office,但是它悲惨的是从来不知道这个软件在真实世界是如何被人使用的,它让几百人甚至上千人做测试,将数据搜集起来,其实只是搜集信息,大概知道你怎么用软件的,却根本不知道最后交付到用户手里是如何使用的。它推出一个“用户体验改进计划”,其实已经拿到了数据,但它想做的只是为了改进软件,所以此数据非彼数据。

  鼠标点击最早能看到的那家公司叫微软,但是Google做了什么事情?就是一个点击没有意义,但当有万万亿点击,同时又有足够的计算能力,而这个计算能力又足够便宜,你能够猜得出商业意图,这时候就变成财富了。所以今天,Google就做两件事情,一是将所有的数据用它的计算能力变成它的基本竞争力,其二是把大家觉得不值钱的事情,就是地上留下的脚印,变成它的财富。所以即使给你数据,你也算不准它的商业意图。

  大家可以想想看,你消耗掉多少计算?单位计算成本是多少?如果你不消耗计算,就像最后石油的价值是炼出来的,不是挖出来的。同时,炼油的成本远远高过最后出来的东西给社会带来的价值,这个生意也做不下去了。因此,计算变得非常重要,只不过有人是用计算的方法,计算在未来会变成什么样子,一定会是公共服务。