大数据的这三个特点导致了机器智能和人具有完全不同的特点,它不是通过逻辑推理归纳演绎得出结论,而是利用大数据的完备性和多维度特点,直接找到答案。而大数据的完备性有可能让机器比人更能够掌控全局,或者说帮助决策者更好地掌握全局。
大数据不仅仅是数据量大,而在于它的天然多维度特点和它的完备性。数据驱动的方法结合呈指数增长的计算机性能导致了机器智能的产生,并且在今天这个时间点上可以比肩人类的智能,这才是大数据重要的根本原因。机器智能和人的智能是不同的,它不是依靠人严密的逻辑推理得到问题的答案,而是通过大数据的完备性直接找到答案,或者根据大数据多维度的特点找到以前我们无法发现的规律性。这将改变我们的思维方式,也就是所谓的采用“大数据思维”。
二、大数据和机器智能的井喷式爆发
大数据这个概念在今天这个时间点被提出来,其根本原因是因为摩尔定律导致互联网的发展,进而使得各种数据量的急剧增长(图5,数据增长的速度快于互联网本身增长的速度)。因此,大数据的第一个来源是互联网,包括移动互联网。大数据的产生还有第二个原因,就是传感器技术的突破--今天各种手机,各种可穿戴式设备都有非常精准的传感器。而一些传感器价格非常便宜(比如RFID,每个售价仅四美分),使得每一个物品都可以装上一个。这些传感器产生了大量的数据。
那么大数据能有多么完备?未来的机器能有多么“聪明”?我们看两个极端的例子。
1.精确到每一个细节
我们来构造两个场景,一个是关于物品,一个是关于人。
我们假定在未来的社会里,每一件物品上都贴有一个RFID(指甲盖大小的不干胶),那么它每经过一道(装有RFID阅读器)门,都可以记录下来,这样我们可以追踪它从出厂一直到被消费掉(或者最终销毁掉)的每一步。将来顾客在超市买东西时,他不再需要在收银台前排队,然后一件件扫描商品算账,而只需要把购物车推出装有RFID阅读器的大门,而那个阅读器将读出他购物车里每一件商品,并且算出价钱。不仅如此,他还能知道商品的来源,这样假货就难有藏身之处。对于厂家来讲,它的意义就更大了,大数据可以能建立起厂家和终端用户的直接联系。以前,厂家和客户之间或多或少隔着一些经销商,因此只能了解自己产品大致的销售情况(比如哪个地区卖了多少),而无法了解细节(比如哪个收入阶层在消费,各个流通环节加价多少等)。但是在大数据时代,它不仅能够知道每一件商品买给了谁,甚至能知道中间每一个流通环节里的细节。因此,它可以完全根据市场供需进行生产,而且可以减少中间环节。对于政府的税收部门,如果可以备份每一笔交易的每一个细节,保证每一笔税收。当时,实现这一切需要多少IT投入,什么时候可以完成现在尚难估计。
接下来谈谈对人的精细化了解。从理论上讲,在大数据时代完全有条件了解每一个人24小时的全部行程。对于使用手机的人,这件事很容易做到。Google向智能手机和Chrome的用户提供一个被称为Google Now的个人资讯服务,它通过大数据(利用多维度的特点)将用户在日常生活中使用的很多(网络)服务打通,让使用者可以非常方便地管理每一天的生活。比如,它通过纪录使用者不同时间所在的位置,自动了解他的住址和上班的地点,每天上下班前,通知用户路上所需要的时间和比较好的行程路线,同时也能通知用户沿路可能发生的拥堵和交通事故。它还可以根据用户的通信(比如邮件),帮助用户自动地将每天的活动自动地加到日历中并且及时提醒下一个活动。事实上,用户在获得这种方便性的同时,将每天的活动全部交给了Google来管理。只要再做进一步的数据挖掘,拥有这样大数据的公司和机构(不一定需要是手机制造商和服务运营商),不仅可以知道一个人任何时刻的位置,而且可以知道他在做什么(比如在打电话,写邮件,开会或者工作)等等,甚至可以知道在什么时候他和什么人见了面(比如两个人在某个地方一起吃了一小时午饭,吃的是什么饭)。对于没有使用手机的人来讲,虽然不能获得如此详尽的信息,每天的活动也是有办法知道的。比如只要他身上任何一件物品是可以识别,或者他的一些生物特征(脸谱、指纹、声音等)可以识别,再经过大数据分析,也能比较详尽地了解这个人的活动。在过去,针对非常少量的人,如果不计成本的话,这件事情也能办到,但是不可能针对大范围的人,而在大数据和机器智能使得了解每一个人的生活变成了可能。