如果说有一家科技公司准确定义了“大数据”概念的话,那一定是谷歌。根据搜索研究公司康姆斯科(Comscore)的调查,仅2012年3月一个月的时间,谷歌处理的搜索词条数量就高达122亿条。
谷歌不仅存储了它的搜索结果中出现的网络连接,还会储存所有人搜索关键词的行为,它能够精准地记录下人们进行搜索行为的时间、内容和方式。这些数据能够让谷歌优化广告排序,并将搜索流量转化为盈利模式。谷歌不仅能追踪人们的搜索行为,而且还能够预测出搜索者下一步将要做什么。换言之,谷歌能在你意识到自己要找什么之前预测出你的意图。这种抓取、存储并对海量人机数据进行分析,然后据此进行预测的能力,就是所谓的“大数据”。
2012:大数据十字路口?
为什么大数据突然变得这么火?为什么《纽约时报》把2012年定义为“大数据的十字路口”?
大数据之所以进入主流大众的视野,源自三种趋势的合力:
第一,许多高端消费品公司加强了对大数据的应用。社交网络巨擎 Facebook 使用大数据来追踪用户在其网络的行为,通过识别你在它的网络中的好友,从而给出新的好友推荐建议,用户拥有越多的好友,他们与 Facebook之间的黏度就越高。更多的好友意味着用户会分享更多照片、发布更多状态更新、玩更多的游戏。
商业网站LinkdIn则使用大数据在求职者和招聘职位之间建立关联。有了LinkdIn,猎头们再也不用向潜在的受聘者打陌生电话来碰运气,而可以通过简单的搜索找出潜在受聘者并联系他们。与此相似,求职者也可以通过联系网站上其他人,自然而然地将自己推销给潜在的雇主。
第二,以上两家公司都在2012年早些时候陆续上市。Facebook 在纳斯达克上市,LinkedIn 在纽约证券交易所上市。这两家企业和谷歌一样,虽然表面上是消费品公司,然而其本质是大数据企业。除去这两家,Splunk 也在 2012 年完成了上市,它是一家帮助大中型企业提供运营智能的大数据企业。这些企业的公开上市提高了华尔街对于大数据的兴趣。这种兴趣带来了空前的盛况——硅谷的风险投资家们开始前仆后继地投资大数据企业。大数据将引发下一波创业大潮,而这次浪潮有望让硅谷在未来几年取代华尔街。
第三,亚马逊、Facebook、LinkedIn 和其他以数据为核心消费品的活跃用户们,开始期待自己在工作中也能获得畅通无阻地使用大数据的体验,而不再仅仅限于生活娱乐。用户们此前一直想不通,既然互联网零售商亚马逊可以推荐阅读书目、推荐电影、推荐可供购买的产品,为什么他们所在的企业却做不到类似的事情。
比如,既然汽车租赁公司拥有客户过去租车的信息和现有可用车辆库存的信息,这些公司为何就不能在向不同的租车人提供合适的车辆方面做得更智能一点?公司还可以通过新的技术,将公开信息利用起来——比如某个特定市场的状况,会议活动信息,以及其他可能会影响市场需求和供给的事件。通过将内部供应链数据和外部市场数据结合在一起,公司就可以更加精确地预测什么车辆可用,以及可用时间。
与此类似,零售商应当可以将来自外部的公开数据和内部数据结合在一起,利用这种混合的数据进行产品定价和市场布局。同时还可以同时考虑影响现货供应能力的多种因素以及消费者购物习惯,包括哪两种产品相搭配会卖得更好,这样零售商就可以提升消费者的平均购买量,从而获得更高的利润。