大数据时代的掘金之道

不久前关于全球最大的全球金融信息服务供应商彭博社泄密客户数据的消息喧嚣尘上,可吊诡的是,本为受害方的华尔街巨头们似乎并不在意,而看热闹不嫌事大的媒体们却纷纷把矛头对准彭博社,想要从中挖掘出点什么料来。

这件事最大的裨益其实是告诉我们每一个人:大数据时代已经来临,信息公开,数据掘金势不可挡。

据相关权威机构预计,全球数据总量每两年就会增长一倍,到2020年人类拥有的数据总量将会达到惊人的35万亿GB。一分钟内全球互联网传送数据64万GB、发布2亿400万封邮件、下载4.7万个App。Twitter用户平均每天发布4亿条消息。2012年第四季度新浪微博日均活跃人数为2800万;产生微博超过1亿条;产生的数据量为1335GB……

一个普遍被认可的概念是,大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。

早在去年3月,美国政府就宣布投资2亿美元启动“大数据研究和发展计划”,把大数据从商业层面上升到国家战略层面。据预测,大数据业务每年将为美国医保带来3000亿美元的价值,而在中国,大数据的潜在市场规模达2万亿元!

美国的海啸预警系统一个案例一直被广为称道,2011年3月11日,日本大地震发生9分钟后, NOAA(美国国家海洋和大气管理局)随即通过对海洋传感器获得的实时数据发布了详细的海啸预警,并制作了海啸影响模型。使世界各国对海啸造成的伤害做到心中有数。

2012年,YouTube实现了40亿美元的收入,其根源就在于对大数据的挖掘和应用。YouTube上所有的数据信息都以单部视频节目为核心,第一次访问、第一次分享、第一次评论都会完整地展现在用户面前,同时还会将时间和URL都一一列出。实现了只要用户想要统计和分析,YouTube会将几乎所有视频的数据都如数供出。

可公开的数据具有商业价值。自媒体时代,人们的所有行为暴露在阳光下,小到一日三餐吃了什么,大到买房买车,所有的数据都在网络中有迹可循。

曾经有一美国男子怒电塔吉特超市:“你们居然向我上高中的女儿邮寄孕妇品广告,想鼓励她怀孕吗?”一周后这父亲去电塔吉特道歉,因他女儿真怀孕了。塔吉特通过数据分析发现:女子怀孕后会买许多无香味护手霜、多维元素和钙片;通过该指数,塔吉特能够准确预测女顾客怀孕情况,并开始邮寄广告。

支付宝[微博]最新数据显示,在过去的一年,全国超过55%的在校大学生已加入淘宝网[微博]上支付的大军。数据显示,网上消费能力最强的大学生群体,并非北上广等一线城市,排名第一的是浙大。数据科学团队用大数据识别大学生身份,并显示出女生淘衣服、男生爱数码,超六成用手机购物。通过数据挖掘,又会让无数淘宝卖家受惠。

在美国沃尔玛超市,人们发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品居然摆在一起,而且这一奇怪的举措居然使尿布和啤酒的销量大幅增加了。原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒。这个发现为商家带来了大量的利润。

所有的这一切都是大数据的功劳。

与可公开数据相对应的是隐私数据。但何为隐私数据,并没有一个严格的判断标准,比如对于普通人而言,衣食住行等等都是个人隐私,非经允许,不能暴露,企业更不可利用此牟利。而彭博社的此次行为之所以被媒体曝光,就是因为其侵犯了客户隐私权。

但对于公众人物而言,则没有任何隐私权。

美国法律规定,上至总统下至政府一般职员,都必须在社会公众前公布个人财产状况。这是一条没有任何人可以凌驾之上的法律,不公布财产者不能进入政府掌握公权。真是因此,每隔四年新一届内阁提名之时是美国政府道德办公室最忙碌的时候,所有经总统提名、需要参议院批准的候选人都必须向联邦政府道德办公室提交财产申报报告。

据美国白宫新近公布的资料,2012年美国总统奥巴马家庭财产在180万美元到近700万美元之间,相比2010年和2011年小幅缩水。形成鲜明对比的是,美国普通民众的个人财产数据是严格受到保护的,非经允许,擅自公布,必受法律追究。