5个故事告诉你何为“大数据”

故事四  发现试图犯罪的苗头

总部位于美国犹他州桑迪市的Secure Alert监控中心曾经发现一个加州的假释者每天下午2点左右都出现在同一个路口。进一步的调查显示,该路口是一个学校巴士停靠站。这里本该是学生聚集的地方,四处也并无其他公共设施,人群较为稀少。于是该公司将这个情况上报到更高层级,并且将该报告通知当地警察部门,以做好准备。最终在假释者试图诱拐一名学生时,便衣警察直接将其逮捕,数月的路径跟踪在公堂上成为了有力证据。

解析:用数据抵御犯罪

Secure Alert公司其实是一家定位技术的提供者,公司正致力于通过进一步自动化从监控到地理位置调查的过程,来增强系统的预测能力。实际上,Secure Alert公司提供了一种内置定位功能的脚环,这种脚环被应用于跟踪预审被告、假释罪犯和缓刑罪犯。该技术使得警察和法院能够实时跟踪和监控犯罪分子,有助于执法者提前预测犯罪行为。Secure Alert的这项预测服务,原理并不复杂,复杂的是将类似的数据收集并形成模式,从中分析作案途径和手法,以便能在任何时间内检测到犯罪分子活动的不寻常模式。

故事五 通过网络情绪预测股市

英国的一名80后外汇交易员保罗·霍廷从3位信息学教授那里获得灵感,随后与他们联手推出了一款利用推特来预测股票走势的对冲基金Derwent Capital(德温特资本),并大胆承诺,公司推出的交易策略可以获得的年回报率高达15%—20%。如此的雄心豪情来源于公司成功的测试效率,他们通过推特上的情绪性词语可以在一定程度用于预测道琼斯工业指数的变化。结果表明人们在网上的情绪变化会在2—6天后影响到指数的变化,研究者称,这使得他们预测的成功率高达87.6%。

解析:数据挖掘进行时

Derwent的创始者们并非最早利用推特预测的人。这家微博网站目前已有高达2亿用户群体,早就被用来预测从电影票房到美国和英国选举的很多事情。而Derwent公司利用计算机程序,每天通过对3亿条推文的抽样,抓取例如“我感觉”、“我认为”、“让我觉得”等表达投资者和公众情绪的语句进行分析、归纳,然后做出推断。他们的试验虽然有待时间的校验,但大数据挖掘的价值已经成为不可轻视的科学热流。