大数据利益相关者的利益矛盾及其伦理治理

2013年是大数据元年,大数据时代的到来,已给我们的生产、生活、学习与工作带来了前所未有的变革,同时也带来了许多的挑战。在一切皆可数据化的新历史条件下,数据成为了最宝贵的资源,通过循环往复的数据挖掘和二次利用,隐藏在数据中的巨大价值正在不断地被挖掘与利用。2014年荷兰学者Andrej Zwitter撰文Big Data ethics(《大数据伦理》)指出:“这里有三类大数据利益相关者(Big Data stakerholders):大数据搜集者(Big Data collectors),大数据使用者(Big Data utilizers)和大数据生产者(Big Data generators)。”在这数据搜集、存储、挖掘、预测与利用的过程中,大数据利益相关者难免会出现这样或者那样的利益矛盾,有必要从伦理视角进行相应地治理,特别是在法律规范相对滞后的前提条件下,实现数据共享的健康运行,最终促进大数据时代的顺利发展。

一、大数据利益相关者的利益矛盾分析

作为利益矛盾共同体的大数据利益相关者,在一切皆可数据化的条件下,应该共同利用大数据技术,挖掘和享有数据的巨大价值。虽然总体而言他们的目标是一致的,都是为了占有与享有大数据蕴藏的巨大价值,但是在总体的共同目标之下,他们又是带着各自独特目标的,特别是在大数据技术还没有全面普及的情况下,由于利益分配不均而导致的诸种利益矛盾将无法避免。

按照Andrej Zwitter的理解,大数据搜集者是按照特定目标来决定搜集和保存哪些数据以及保存多长时间。显然大数据搜集者的目的并不是为了搜集而搜集,为了存储而存储,之所以要搜集与存储,就是要利用数据进而占有和享有其中的巨大价值。正因为是带着特定目标来搜集和存储相关数据,所以必然会导致有所选择。而这样的结果就是,所搜集和存储的数据相对于某一特定目标而言是整体而全面的,但是相对于其他目标则不尽如此了。因此,特定目标直接影响了数据的整体性与全面性。换句话说,大数据搜集者只能搜集和存储与某一特定目标紧密相关的数据,并想要以此来实现这一特定目标。但是,特定目标最终能否实现还要依赖于大数据使用者。

大数据使用者主要是利用大数据技术对已搜集和存储的数据进行挖掘、预测和利用。他们可能是带着特定目标来进行的,也可能是毫无目标的。大数据使用者才是真正的大数据技术掌控者。由于大数据使用者拥有独特的技术优势,完全有可能导致数据在挖掘、预测和利用中偏离大数据搜集者的初衷,因为数据能够不断地被二次利用与挖掘。因此,如果大数据使用者在数据挖掘、预测和利用中产生了超出大数据搜集者本来目标的新价值,那么该如何分配,是共享还是独享?特别是由于技术优势的存在,大数据搜集者可能根本就不知道原来搜集和存储的数据产生了怎样的新价值。当然,如果大数据搜集者和大数据使用者是同一群体的话,就不存在这样的问题。问题的关键在于很难真正实现二者合二为一,因为大数据搜集者是带着特定的目标来搜集和存储的,他们仅仅能够在实现某一目标的过程中既是大数据搜集者,也是大数据使用者,但是数据的二次利用呢?因此,大数据搜集者和大数据使用者很难实现完美合一,总是处于矛盾地合作中。

如果说大数据搜集者和大数据使用者处于利益矛盾之中是因为无法实现利益最大化的话,那么大数据搜集者、大数据使用者和大数据生产者之间的利益矛盾则是如何实现伤害最小化了。相比较而言,大数据生产者一直处于最被动地位。因为大数据生产者每时每刻都自觉与不自觉地生产着数据。在大数据时代,一切皆可数据化,大数据生产者的一言一行都必将以数据的形式存在。这就导致了大数据生产者根本就无法知道哪些数据被搜集和被存储以及存储了多长时间,并且根本就不知道自己生产的数据在何种目的的作用下被挖掘、预测与利用,更不可能知道自己生产的数据在被挖掘、预测和利用了之后将对自己产生怎样的影响。因此,对于大数据生产者而言,只要不对自己产生消极影响就足够了,根本就无法想象还能从中获取本属于自己的价值。如此看来,大数据生产者和大数据搜集者、大数据使用者也必然处于利益矛盾状态:对于大数据搜集者和大数据使用者而言肯定是要尽可能多地搜集、存储、挖掘、预测和利用大数据生产者的数据,这就不可避免地会对大数据生产者产生消极影响,例如对隐私(Privacy)、机密(confidentiality)、透明(transparency)、身份(identity)和自由选择(free choice)等构成了威胁;对于大数据生产者而言,由于处于被动地位,只希望自己的利益能够得到有效保护,将伤害降到最低限度;如果伤害一旦产生,则希望能够得到相应的补偿,包括物质的和精神的。