谁拥有你的数据?谁又动了你的数据?

谁能拥有你的数据?

很多时候我们不会去阅读服务协议,却习惯于签署、通过它们。但现在,这越来越成为一个民生问题了。像 UPS 和亚马逊这样的物流公司,能通过他们先进的监控网络,对员工进行微观管理。而国际零售商和快餐连锁店,则可以利用复杂的数据反馈效率算法生成雇员的时间表。孟山都的“智能农场”技术从大批独立的农民那里提取出有价值的内部数据,而优步司机甚至可以通过建立规模空前的细节数据库,来帮助开发他们的自动驾驶替代品。

数据

长期以来,资本家一直从他们的工人那里收集有利可图的数据而不付任何报酬,但直到最近,网络智能技术的发展——兴趣网络——将数据监控延伸到工作场所之外,让我们的个人生活成为了无酬劳的价值创造领域。数字零售商根据我们的个人情况提供针对性的推荐;流媒体揣摩我们的品味以预测我们将欣赏什么内容;而健身应用追踪我们的卡路里摄入和行走步数以让我们做出“更健康的决定”。很快,虚拟现实的头戴设备甚至可以追踪细微的眼球运动和无意识的视网膜活动。

这些技术通常将我们的个人信息反馈给私人公司,在那里,我们的购物偏好、兴趣和身体机能数据,都有可能为它们巨大的利润。如果没有我们的个人数据输入,大数据是不可能存在的,而数据分析市场更不会在没有大规模合作的情况下发展为 1300 亿美元的产业。被动数据收集越来越多地将我们的闲暇时间转化为工作时间。

当 1996 年谷歌开始实施网页排名算法时,拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)无意中开启了从源头改变信息传输渠道的方式。斯坦福的博士学生最终开发出了一种算法,将他们搜索引擎外包给他们的客户,即享受免费服务的用户,从而通过链接密度和用户参与程度的统计数据,来对网页网址不断扩充的缓存内容进行排序。用户只要对网页进行搜索就能完善算法,因此也吸引了更多的消费者来改进产品,从而为搜索引擎提供更大的锻炼平台。

这是新古典主义经济学家“良性循环”的一个理想模式,这个过程是消费者驱动大数据的第一个明确案例。它是创新的,因为它将创造有用数据的过程,从大规模的制造转变成了大规模的消费,最终使得搜索引擎的竞争对手,例如 AltaVista、HotbotheWebCrawler,以及拥挤的门户网站如 MSN、AOL 和 Lycos 变为它身后默默无闻的隐藏劳动力。

很少有人知道,在 2001 年年末,谷歌正静悄悄地考虑对这个“良性循环”进行调整,以测试一个投票系统,从而允许用户公开透明地影响搜索排名的结果。SiteLab 的联合创始人 Dana Todd 将更具有参与性的途径称为“用户意识”,但这个公开透明的特性从未引发市场热潮。正如谷歌发现的那样,最佳的海量数据采集方式——是隐蔽且间接的。

例如问卷调查或客户服务调查这样积极的、直截了当的信息交换,揭示了劳动力如何参与反馈一个神奇的算法。但谷歌没有选用积极邀约,反而加强了被动数据收集,并通过物理空间(谷歌地图)、可预期的未来(谷歌日历)和可量化的每日网络使用情况(谷歌 Chrome 浏览器)来扩大收集范围。这些累积的数据,都在隐私页面所提及。

很快,这些隐藏的交易不仅仅是谷歌的核心,也成为了亚马逊的商业模式。早在 2003 年,在与谷歌相似的时间,这家互联网零售巨头也开始利用客户的个人数据盈利,亚马逊用大量的个人购物历史对算法进行调整,建立商品间的相似指数和消费者分析工具。利用元数据构建复杂的推荐系统,该公司很快就成为了有目的投放在线广告的先驱。表面上,亚马逊将零售店员的帮助工作自动化了,但实际上,公司只是将店员的工作放在了消费者自己身上,在消费行为中完成工作。

乍一看,这个模型完美契合了影评人 Annette Michelson 在 1979 年所说的金句,在电视广告的时代,“你就是最终交付给广告客户的产品。”但互联网的数据经济将此变得更为复杂:谷歌和亚马逊开始已经开始接受消费者数据,正如其他早期的互联网巨头利用他们的人气努力赚钱一样。当时,广告商对网络并没有兴趣,因为它没有电视的受众,而且利润回报率很低。现在,谷歌和亚马逊通过凝聚全球市场的劳动力来回避这个问题。谷歌依靠用户输入来创建主导产品,而亚马逊却把客户转变为一个庞大的个性化销售团队。他们都利用自己的权限,把用户数据转化成了有价值的商品。