数据交易史话:隐私、定价、交易与策略初探

倘若上述闭环并未合上,则不存在隐私侵犯的问题。如用户个体数据被加工为各类宏观统计数据,如百度迁徙数据,或者数据没被用于针对用户本身的营销或洞察行为之中。如用户的Netflix电影评分数据随同NASA的最新探测器被作为人类社会行为的样本发射到了太空,即使数据中含有了敏感的PII信息(个人身份可辨识信息),用户也不必担心在有生之年会因为在《独立日》中的高评分会被外星人找麻烦。

个人隐私保护是数据交易当前的焦点问题,鉴于其中的巨大挑战,本文无意深入探究数据交易隐私保护的技术与方案。但实际上业界对于数据交易的隐私保护已经有了一定的尝试,其中在线广告的数据交易平台的实践是值得我们去玩味的。

虽然目前数据交易是非常热的一个话题,但实际上能通过程序化形式每天开展大量数据交易的,业界里恐怕只有在线广告的在线用户行为标签数据交易,这种数据交易形式被广泛用户RTB等竞价广告的客户定向之中。简单而言,DMP(数据管理平台)会通过各种渠道聚合在线用户的行为数据,并加工为有价值的用户标签数据,并出售给广告主(实际为DSP)用于广告的精准投放,从而提高广告的投入产出。这种明细用户的标签交易形成了上述四方问题的闭环,必然会带来用户隐私的困扰,那DMP是如何去界定与解决的?

我们以去年被Oracle收购的广告数据管理平台商Bluekai说明。Bluekai的商业模式主要是从各类中小主题网站及其他来源获取用户数据,加工为各类用户标签,比如近期想买奥迪汽车的人、想去米兰度假的人等,并出售给广告主用于精准投放。鉴于Bluekai作为一家具影响力的DMP以及这种堂而皇之的个人数据出售方式,必然会引起数据隐私的问题,作为解决方案,Bluekai搭建了一套用户隐私保护体系,上面明示遵守了那些法律法规,明确了收集与不收集哪些数据,让使用者可以看到自己的资料是在被谁使用,并且让用户随时可以选择opt-out。

除了告知外,Bluekai还具备用户自主opt-out机制,下图是微软MSN、Outlook.com以及其他微软网站和应用上应用了用户标签数据的个性化广告的隐私说明和opt-out页面,用户可自由选择是否接受个性化广告的投放。而在数据的收益权上,有趣的是,Bluekai甚至允许用户选择将因为使用自己数据获得的收益捐给慈善机构。

数据交易中的隐私保护是一个蕴含巨大挑战的课题,本文认为其中至少有三点是必不可少的:法律层面个人信息及隐私立法、对用户透明公开的正常与数据使用情况、以及用户拥有部分数据交易收益分配权。而这些举措毫无疑问不是市场自身能够完善与执行的,除了国家层面的推动以外,数据交易市场是其中最重要的推动力量。

另外,数据交易市场在上述“四方问题”中的核心定位,在于降低数据交易过程中的交易成本。数据交易市场需要具备核心能力从而最小化整体市场的交易成本,关于这点在接下来关于数据交易市场的章节将会进一步讨论。

第三部分 未来的数据交易市场

数据交易市场存在的意义,在于显著降低数据交易的交易成本,否则数据交易双方是没有任何理由在交易市场开展交易的。数据交易的成本,由搜寻成本、因信息不对称导致的风险成本、议价成本(狭义的交易成本)组成。其中搜寻成本是数据买卖双方对接需求并成功撮合所需要付出的成本;而风险成本是由于数据交易的双方信息不对称,所出现的卖方夸大数据价值、以次充好等道德风险行为;而议价成本是双方在数据定价问题上讨价还价带来的价值损耗,大家不妨回忆本文第一部分关于数据价值的相对性的论述,就不难理解如果缺乏一套有效的数据定价机制,交易双方会围绕数据定价损耗大量的精力与成本。

那么数据交易中心该如何降低上述的交易成本?交易成本的最小化,是任何一个多边平台的最终目标,也是一个艰难的课题。本文试图通过四个问题,从不同角度进行穿插梳理,权作抛砖引玉——

问题一:在数据交易市场,交易对象是什么?

数据交易中心中可交易的数据。可以根据上一章节 “四方问题”中是否有形成闭环分为两类:第一类是非闭环数据,即不涉及任何个人隐私的统计性与科研数据(为方便起见,这类数据下文称作“第一类数据”)。如各类经济及行业统计数据、用于工程及研究目的得各类如声音语料库、城市交通数据、匿名的上网行为数据等。这类数据由于不涉及到个人隐私,一般可以认为产权属于所有方,采取“柜台式”报价挂牌交易即可。