大数据下的个人隐私

珍妮·维特西(Janet Vertesi)是普林斯顿大学的社会学副教授。她一直有这样一个念头:自己怀孕了这件事,是否能不让大数据察觉到? 之所以有这样的想法,是因为她就是专门研究用户和信息技术之间的关系的。她相信怀孕的妇女,从商业角度上来说是一座具有极大潜力,可供开发的”金矿“。量化一下,针对孕妇所挖掘出来的各种营销数据的价值,比普通人要高出 15 倍。所以大数据对与孕妇有关的信息,会抓取的非常敏锐和及时。现在,她就想挑战一下大数据的监测能力!结果是她失败了。其结论是:躲开大数据的洞察,极为不方便,成本代价极为高昂。维特西不推荐任何人这么做。科技公司都曾经纷纷表示:如果用户们很不爽现在的隐私保护策略,那么你就绕开好了。其实显然不是这么回事儿。最近维特西接受了我们的采访,谈了她的实验,实验背后的意义,以及为何躲开大数据会让你显得像是一个鬼鬼祟祟的罪犯。

问:你是怎么想到做这样一个古怪的实验的?你通过什么办法来向大数据隐瞒你怀有身孕的事儿?

答:我去年曾经看过纽约时代周刊上的一篇文章,说的是塔吉特公司通过大数据分析,比如种种消费习惯方面的信息收集,提前预测某位女生她会怀孕!(注:塔吉特百货公司,总部在美国明尼苏达州的明尼阿波利斯,是美国仅次于沃尔玛的第二大零售百货集团)这样一件事对我的震动很大。我知道这互联网上有着各种各样的挖掘隐私的工具,各种各样的跟踪定位,但是我没想到这些零零碎碎的信息所形成的大数据,能够如此紧密的贴合应用到零售业。我想知道它对于每一个个体来说,究竟影响有多大。我知道这是信息化社会的趋势,没办法阻挡。做这样一个实验,仅仅想搞明白我该如何绕开种种大数据的监测。我是否能做到这一切?

问:在这项实验开始,你在社交性媒体中陷的深吗?你是那种给 Instagram 上的点赞狂魔?还是仅仅出于礼节,在 Facebook 上祝某人生日快乐一下呢?

答:打从 Facebook 首次开放测试的时候,我就开始在那上面混了,算算已经有将近十年的时间。两年前,Google 变更了用户隐私保护政策,因为此事,我拒绝使用 Google 的所有产品,曾经有段时间我是坚定的 Google 黑。对于很多人而言,如 Facebook 、Instagram 和 Twitter 提供的服务,大可以说我不爽了闪远便是。但如果是一个寻找工作的人,LinkedIn 是你拓展自己职业生涯的平台。而对于我来说,Facebook 上同事们的社交互动,是我研究的社会学领域中重要组成部分。所以,离开这些社交网络几乎不可能。

问:关于让怀孕的事,躲过大数据的实验,你是怎么做的?

答:首先,我的丈夫和我决定,在任何社交媒体上严加管束我们的嘴巴。我们同样还会要求朋友和家人也不能说。这可不是你一个人的事儿,有些时候你的朋友说了什么,以及他们是否@了你或者标签提到了你,都有可能泄露怀孕这个事实。所以我就给身边的每个人解释了我所做的实验,并且表示,关于怀孕的事儿我们是很开心,但请不要将它放到网上,尤其是不要放到 Facebook 上,因为这个社交平台上充斥着各种收集数据,侵犯个人隐私的事。我们在网上购买一切与婴儿有关的物品,全部是通过 Tor (The online Router) 来实现。(注:Tor 是第二代洋葱路由的一种实现,用户通过 Tor ,可以在因特网上进行匿名交流。最初该项目由美国海军研究实验室赞助)很多人问我是否下载了 ad blocker 插件(屏蔽互联网广告的一款工具),我没下。因为下了这个插件,我就不知道这个互联网到底了解我有多少了。我在上网时,处理与怀孕根本不沾边的其他事情,都用普通的浏览器,但是一旦涉及到怀孕的事,我就用不留痕迹的浏览器。能用现金购买的东西,我们就用现金解决。某些网上购物是通过 Amazon 来完成。我们注册了一个新号,这个号下面注册的地址也不是我们的住址,而是位于曼哈顿的一个寄存柜。我们用现金支付时,Amazon 的礼品卡全部都放在那里。我们所做的种种努力,就是要在线上和线下划出明确的界限。

问:用 Tor 来购买婴儿用品,听上去还真是可爱。因为一般我听到 Tor 的用途,都是跟毒贩有关,又或者是人们在用比特币做一些非法交易。对此你怎么看?