大数据战争 即将到来的全球数据革命

关于人类行为的预测,其实只需要理解一条精髓就好——人都是习惯的奴隶。事实上,精确地预测出一个人下一分下一秒会做什么动作毫无必要。只需要大概预估出某人在某一天的某一个时间很可能出现在什么位置,就已经能产生巨大的作用和影响了。以你自己为例,想预测你周三下午3点的位置一点也不难,因为你在工作单位的可能性非常之高。工作日里,你起床、出门、乘坐何种交通工具,到达单位,吃饭以及回家的时间和路线基本都有章可循。稍稍研究一下你周末的出行和聚会习惯,也可以发现不少规律。甚至细想一下,你和某人约会的地点,都很可能常常是某一家咖啡馆或餐厅。也许你会生病请假、出差办事,但那都是异常情况。我们基于各人习惯进行预测的准确度确实会因人而异,但总体上讲,准确度都比你想象的高。

由于人类从来没有像今天这样如此依赖网络和电子设备,因此,大数据时代产生如此多的电子踪迹让研究每个人、每个群体,甚至整个人类的习惯成为了可能。这可以带来很美好的生活。比如,基于对你位置的实时定位和数据分享,在你进地库时就开始着车,进门前就亮灯,坐在位置前电脑就开启,咖啡就上桌,这些在技术上并不难实现。同样,基于对你的踪迹的预测,你每走一步之前都可以设计好一个陷阱等着你,你这一步踩不到,下一步也总能踩到。以前的“飞天大盗”要实地勘察几个月甚至数年来分析某人或某机构的习惯规律以实施犯罪行为。以后,只需要一台电脑和简单的黑客手段就可以做到了。而GPS实时定位信息及预测仅仅是大数据时代一个很小的断面,你可以据此推想其他方面更为美好或更为恐怖的生活状态。

商机还是危机?竞争还是战争?

当你进入亚马逊的网站时,它会“猜测”你可能会喜欢什么样的产品,并在首页给你推荐。当你浏览京东网页上的某一产品时,类似的产品链接就在旁边方便你点击、比对。这是因为在电脑上,你什么时间浏览了什么网站,点击了哪些链接,网上购物时买了什么样的东西,花了多少钱,你中间点击了哪些、什么样、什么价格的产品,最后做出了什么样的选择都有迹可寻。大型电商网站会基于这些数据,分析顾客习惯并优化自己的产品结构,变更网页,以达到促进、方便消费的目的。这是通过“数据相似性”的简单应用就达到特别成功效果的一个典型案例。由于云技术和物联网慢慢渗透到我们生活的方方面面,以及物流业的蓬勃发展,我们过上了更为便利的生活。也正是基于这些变化,实体商店正在电商的打压下迅速走向衰落。

从企业层面来讲,大数据已经带来了产业的巨大改变,因此这是一个商机和危机并存的时代。比如,看着淘宝、京东实力的扩大,传统的电器卖场苏宁也开始走向电商转型的道路。银行保险业更是先一步就建立了大规模、高水平的数据中心和研究机构。理财、保险产品的设计和定价没有客户数据的采集和分析作依托,就是无稽之谈。谷歌、微软之类的公司之所以强大,正是因为庞大用户数量带来的海量用户大数据让他们占尽了优势。

从国家层面来讲,大数据同样已经成为一个改变实力消长的重要环节,国与国之间的竞争在大数据时代的表现将是信息上的残酷战争。这并不是危言耸听。在过去,掌握真实材料和撰写历史是只有极少数人才可以享有的一种特权,研究和发现人类的行为规律很难也很不精确。而在大数据时代,无法估量的信息数据就那么冷冰冰地躺在那里,它本身虽然没有生命,但是通过管理、筛选和分析,许多关于人类社会行为的论点会被验证也会被推翻,许多人类行为的奥秘也会浮出水面。正如同掌握了日月星辰的规律才可以预测并加以利用一样,未来谁能从大数据中发现并掌握人类行为的规律,才能在信息时代的严酷战争中处于优势地位。

大数据是不是让我们更加无助?

应该说,在科技改变生活的大数据时代,人文社会科学领域燃起了新的希望。在科学的研究方法指导下,社会调查和实践的难度在降低,规律的发现和验证变得可行。以往社会科学工作者们对于社会组织架构及人类行为的许多理论都是空想,以后基于大量科学、可靠的数据,就可以进行实实在在的调查研究。

大到一个国家,小到一个行业,这些数据都非常宝贵,其重要作用不可小觑。举一个简单的例子,我们国家是一个人口基数庞大的国家,因此病患也非常多,从医疗卫生的角度考虑,医疗、养老都是巨大的负担。但是,如果我们从医药、治疗的角度来讲,这些病患则是一笔巨大的财富,患者生病、治疗及用药产生的大量数据为我们进行医疗研究、药品研发提供了大量鲜活的样本。实际上,中国也正因为患者样本的高充足率,已经成为了国际药品企业争相利用的市场,而中国的不少医生也因为“见多识广”而成为技术娴熟的名医。同理,由于人口众多,大数据也为我国社会科学领域的迅速崛起提供了前所未有的机遇,如果能把握住就能赢得未来,把握不住就会一败涂地。