本周早些时候,美国科技博客 Techdirt 创始人兼首席执行官迈克·马斯尼科(Mike Masnick)抱怨说,对于美国国家安全局(NSA)收集民众使用手机和电子邮件的元数据(正如斯诺登所泄漏的那样)的行为,“因其只是涉及元数据而认为这种行为无所谓的人根本不知道什么是元数据。”其论据是,实际上,你无需阅读他们的电子邮件或者窃听他们的手机通话,通过这些元数据便可以了解许多有关用户信息,包括他们与谁交往以及可能谈论什么。
巧合的是,麻省理工学院媒体实验室(MIT Media Lab)本月发布了一款叫做 Immersion 的工具,这款工具让人们能够分析自己的电子邮件元数据,该工具可以搜索用户的 Gmail 电子邮件账户,只查看其中电子邮件的元数据(发件人、收件人、抄送人以及时间标记字段),然后绘制并呈现用户联系网络的概况图。
如果你放心把这些数据交给这个 MIT 研究小组的话——他们承诺可以让你过后删除这些数据,那么不妨一试,看看这款工具会揭示有关你的哪些个人信息。该研究小组告诉我,到目前为止,已有 210,000 人运行了这款工具。我是其中之一。以下是我自己运行 Immersion 后得到了概况图,这幅图显示了我从 2004 年开始使用 Gmail 以来的联系网络概况。我已在这幅图上删除了我的联系人姓名(出于隐私保护的原因),但对部分节点和集群做了标注。MIT 教授伊森·扎克曼(Ethan Zuckerman)曾与产生这款工具构想的学生合作过,他在公开自己的联系人方面不像我那样拘谨。
值得注意的是,这款工具之所以可以做到这点,只是因为我们习惯于把一切存档。我保存了 70,000 多份电子邮件,没有删除它们。
在 2009 年和 2010 年,我的电子邮件的数量达到最高水平,当时我把自己的个人电子邮件账户用于工作。引起我注意的是,我的联系人集群的分布形态。配偶或恋人很容易识别,而且也很容易发现为我部分报道提供消息的人——窥探者可能对此感兴趣,因为这些人与我的联系网络中的其他人都没有联系。
《卫报》(Guardian)撰稿人约翰·诺顿(John Naughton)说:“事实是,正如我在两周前所述,间谍想得到的正是元数据,其原因很简单,因为元数据是可用计算机进行处理的,因此是可以搜索的。正是如此才使得互联网规模的全面监控成为可能。”
如果没有其他情况的话,那么这款工具是量化哪些联系人对你有多重要的一个方式,而且由于可以滑动时标,你可以看到有些联系人对你的重要性随着时间的变化而起伏变动,代表他们的气泡会膨胀或收缩甚至消失。即使这些只是元数据,但从这个角度来审视我的社交网络的话,几乎和在阅读旧电邮或者在谷歌即时通讯服务 gchat 上度过时光一样令人印象深刻。
这款工具的开发者表示,该工具的发布与这次 NSA 收集个人信息的秘密曝光没有任何关系,但他们也表示,希望这款应用程序会促使人们认真考虑隐私问题。这个工具的网站说:“这款工具通过显示已与别人分享的用户数据,帮助用户探索隐私信息。”
我问他们这里的“别人”是指谁。麻省理工学院媒体实验室的迪帕克·贾格迪什(Deepak Jagdish)通过电子邮件回复说:“是指用户已经让自己的数据与其进行分享的那一方,在这个例子中,这个对方是谷歌,因为我们目前正使用 Gmail 作为电子邮件提供商。”
由于我们如今的生活方式,当我们大多数数字通信由第三方负责的时候,我们都在不断把大量的数字踪迹留给他们,而这些数字踪迹透露了太多关于我们的信息。当谷歌推出社交网络 Buzz 时,谷歌促使其用户最亲密的 Gmail 联系人群信息被公开。这个隐私保护方面的错误让谷歌感到后悔,而谷歌的声誉也因此受到严重影响。当然,现在越来越清楚的是,情报机构对这些数字踪迹感兴趣。
如果你不使用 Gmail 的话,那么你可以使用沃尔夫勒姆研究公司(Wolfram Research Company)提供的一个工具来进行类似的分析。那么,对于用户提交的所有这些有价值的元数据,Immersion 开发小组计划做些什么呢?
贾格迪什说:“我们让用户能够保存自己元数据的首要原因,是当他们下次来访时可以更快地启动概况图的生成进程。此外,在未来,我们还计划为所有已保存各自 Immersion 档案的用户计算一些汇总统计数据,但我们决不会公布任何个性化形式的任何数据。”
更多详细信息,请您微信关注“计算网”公众号: