大数据到底怎么影响我们的生活

发生了根本性的变化。与我们现有方法的不同之处在于,我们更深入地研究个体,而非一个群体。就拿糖尿病来说,目前可能有 100 种不同的糖尿病亚型,而且你和你的邻居得这种病的原因也各不相同。你可能是因胰腺β细胞功能受损所致;或者你肌肉中的摄取受体不能有效地吸收葡萄糖等等。不同的病因可能需要不同的治疗方法。

医生看到的只是晚期症状,但现在透过各类分辨率更高的科技产品他们能看到导致下游结果的上游病因。最近医生们才看到了这些病因。其中涉及数百万个变量,这是人脑无法理解的。

您刚才说到的都是数学帮助克服人脑缺陷的方面,这些数学计算程序有哪些缺陷需要人脑的帮助?

我们所做的工作是用一种需要人脑参与的方式来呈现信息,这是一种很棒的模式识别机器。目前在很大程度上人与机器是合作伙伴关系。也许 10 年、20 年以后,诸如 Watson 等计算机将变得非常强大,人的干预会大大降低。但目前还做不到。

很多组织收集的医学数据只供己用,我们应该对此感到担忧吗?

如果我们真的希望对人类健康产生影响,这些数据和模型必须对所有人进行开放。

物理研究领域就有这样的先例,强子对撞机试验的全部数据都是对公众开放的。当然,存在如何保护个人隐私的问题。

可以通过技术解决隐私保护问题吗?

我们当然可以保护并存储数据,保护计算机环境的安全,并采取众多安全协议来确保数据不会陷入危险。但有一点我们很清楚,任何形式的高维数据都无法真正做到匿名。就像照片一样。你不能指望你的外貌也有隐私,因为人人都能看到你的脸,你不能将它藏起来。我认为 DNA 以及诸如分子尺寸等其他数据最终也将归入同样的范畴,原因很简单,当技术足够成熟的时候,基因测序会像照相一样简单、便宜。

在日常生活中,你是如何应对信息过载问题的?

不能陷在大数据中。我会去玩单板滑雪、骑摩托车,或是做一些能帮助你放松,无需太动脑筋的活动。

安德烈斯·维根 Andreas Weigend

独立顾问,亚马逊公司前任首席科学家

你曾经将大数据比作原油。

如果你在后院发现了原油,你的这个发现可能用处不大,因为你需要将原油精炼后才能供人们使用。原始数据也像原油一样,不是拿来就可使用。亚马逊和谷歌就是从事数据精炼提取的公司。当然,据我所知,原油和数据两者之间最大的区别是,数据一时半会儿不会被用光。而至于价格,信息产品和石油产品之间的关系也非常有意思。

原油的大部分好处被你所描述的精炼公司而不是被其用户获得。我们怎样才能保证每个人都能从大数据中获益?

我认为,在苹果公司的应用商店发生的一切将会在数据经济领域再次上演,会有公司以这些数据为“原材料”推出服务。如果成立一个应用商店,而另一家公司使用数据向消费者提供应用并与数据公司共享收入,价值由此产生。

大约 10 年前,你曾担任亚马逊首席科学家。目前,世界是否已经完全变样了?

10 年前,我们已经注意到行业的重点正由算法(意味着你可以从自己所有的数据中获得任何东西)向仅仅需要获得更多的原始数据这一方向转移。所以说,现在的情况与当年完全不同,不过,我们仍然有类似的想法。贝索斯还是贝索斯。

你认为哪些行业守着最丰富的数据金矿却未找到利用金矿创造价值的方法?

中国有一家公司名叫腾讯,他们推出的微信完全颠覆了中国人的沟通方式。与之相对应的另一家公司是中国电商公司阿里巴巴,该公司了解客户对哪些商品感兴趣,他们在搜索什么商品,以及他们最终买了哪些商品。阿里还清楚客户是否退货和有无付款问题等。

这两家公司均拥有 10 亿客户。它们了解客户的所有沟通习惯或所有财务交易情况,所以,它们确实大有可为。当然,这也取决于你对哪些行业感兴趣。不过,真正的潜力是这两方面数据的交叉整合。比如,在需要做出信贷决定时,你可以从腾讯了解很多信息。因为,了解到你是否曾经和妓女鬼混或与拉皮条的家伙有过来往,也能多多少少地了解你将来偿还贷款的倾向。

在日常生活中,你是如何应对信息过载这一问题的?

我们必须形成一个认知习惯,认识到人们是会错过一些信息的。如果有人错过了你的一封电子邮件,请不要生气。请通过另一个渠道与他们联络。