据中国之声《新闻纵横》报道,近日,百度新近推出的景区热力图受到很多旅游爱好者们的追捧。用户点击进去后,对于所在城市甚至全国各地的景区实时热度可以随时掌握。一个互联网公司,怎么就能够知道春运大潮的动向?这就是大数据的功劳。
大数据,顾名思义,简单说就是通过海说量的数据分析,洞察趋势性的变化和关键性的决策信息。2014年,大数据已经准备好为人们的生活带来更多方便,当然也会有担忧。
科学家预测,到2020年,每个普通家庭产生的数据量,会比半个图书馆存储的还要多。科学家还预测,目前人类产生的数据量如果刻成光盘,可以搭起五条从地球到月球的通路。但这些听起来,一定还是虚幻的不得了的尖端科技。但事实上,这些数据里,有许多就来源于您自己。您在网上的每一次搜索,发在朋友圈里每一张照片,都为这些数据的增长做出了贡献。
深圳电子商务规划部副部长洪培林:因为在过往我们的很多行为其实没有搭上数据标签。今天我们很多行为,比如说在网络上的检索行为甚至我们跟人家探讨的共同的话题,甚至我们浏览的一些网站等等,这些信息都会让我们在这些平台上留下数据脚印。
而如今,数据的搜集方法更加多样。智能手机的普及正在源源不断的回传使用者的各种数据,你吃了什么,你在哪里,这些你妈妈可能不知道,但你兜里的手机知道。你打开手机上的打车软件,顺利预定了一辆出租车,与此同时,你的位置信息,也成为了百度LBS开放平台上的一个蓝色光点。
百度公司公关部张丽媛:百度对这个拥有的定位大数据进行了一个全样数据的处理分析和挖掘,将数据库手机定位数据,变化映射为人群迁徙轨迹,并且实现了这种可视化,而百度的定位大数据是来自于百度地图LBS开放平台,百度地图LBS开放平台提供了定位服务在几十万款APP上都有所使用。每天为手机网民提供了35亿次的日定位的请求,我们通过开放平台的模式这几十万款的APP都成为百度的一个数据源。
这些沉淀在互联网中的数据到底有什么用?互联网企业们正在用它们完成掘金的过程。在电商领域,风光无量的马云宣布离职不久就重新出山,张起的大旗就是利用大数据构建智能互联网的新行当,对于数据的批量分析,让电商似乎比你自己还知道你想买什么。而大数据能够做到的,远不止这些。这个冬天,不少人都吃过流感的苦头,甲型H1N1流感的死亡案例也让许多人戴上了口罩。事实上,2009年甲型H1N1流感第一次走入人们视线时,来自谷歌流感趋势系统的大数据就为疾控部门提供了精准的预测,从而使对疾病蔓延的控制有的放矢。海地大地震时,在废墟中绝望的求救者突然看见了搜救人员,因为人们在社交网络的定位信息给搜救行动提供了坐标。
洪培林:在今天数据已经不仅仅是来源于我们网络上留下的信息,可能我们的车辆的信息,我们的导航的信息,会记录进去会有助于比如说交通的规划,它其实有利于我们改造这个城市的规划。
但担忧随之而来,一个人今天知道你从哪儿到哪儿不算侵犯隐私,那么如果他一年365天,天天都知道你从哪儿到哪儿,是不是就让人不寒而栗了呢?因为这种担忧,许多正在使用大数据的公司都强调,自己所收集的数据,并不会对应到具体的人。
张丽媛:每台设备都是百度LDS数据库当中的一串代号和编码,最重要的是,这台设备的定位数据并不会与人的身份相对应。比方说举个例子在实现实名购票制之前,他知道旅客从哪里来到哪里去,但并不知道旅客是,情形就是差不多类似这样的。也就是百度掌握和使用的是批量化去身份化的一种数据,关注的是群体性的趋势而不是个体的行为,因此它不会涉及到公众隐私及其滥用。
但大数据仍旧是一柄双刃剑。个人信息安全备受冲击的今天,被不知不觉收集起来的个人信息,真的能被妥善保管吗?只关注大量数据的分析,不与个人身份联系在一起,这条底线,企业或相关部门,真的能做到么?
无限趋势咨询创始人王越:到了互联网时代,尤其是现在的大数据时代,很难去保证用户数据安全。因为只要一上网,用户信息实时就流失掉了。还有你必须去用各种服务码,等级各种信息,银行和电信都没办法保障你的安全,一般的互联网公司就算他再有责任心,也很难做到,慢慢会变成大家已经开始习惯,数据被盗用,个人信息被消费,来换取一些相对免费的或者是增值的互联网信息对时代的一些服务。