数据交易史话:隐私、定价、交易与策略初探

关于这个本文自创的“数据普惠”说法,这里想稍微延伸一点:第一类数据实际上是属于基础类数据,带有“准知识”的特征,如气象变化数据、城市交通数据、语料数据等。只要不涉密,让尽可能多的需求方拥有它们实际才是社会价值最大化的做法,过中道理就如知识不应该被垄断一样显而易见。

对于第二类数据(个人特征行为数据),由于能赤裸裸地用于如个人征信、营销等商业用途,其价值相对性的波动会非常大,大到甚至连供给方都不能准确评估其市场价值的程度。因此,第二类数据比较理想的定价方式是需求方定价。关于数据的需求方定价,在本文第一部分有简单涉及,而上一章节提及的在线广告数据平台Bluekai,其数据定价方式实际上也是采取数据竞拍即需求方定价的方式,价高者得,同时控制数据的供给数量,确保一份有价值的数据仅被一到两家客户所有。

个人特征及行为数据的鲜明特点是超乎想象的细分程度,数据需求方仅会对其中一小部分数据感兴趣,例如上海的淘宝卖家只关心江浙一带的用户数据,使得供给方对千千万万的细分数据做定价变成了几乎不可能的任务。正如当初Google推出搜索引擎关键字广告时,根本不可能对几百上千万的各种关键字逐一定价出售,最有效的方式就是采取需求方定价,即关键字竞价形式,综合出价最高的广告主将赢得对应广告位的展示机会。

当然,为实现第二类数据交易的需求方定价,数据交易市场的规则设计是核心问题,另外还离不开的是数据产品化。在交易之前, 数据知识发现KDD(Knowledge Discovery in Data)应该由数据交易市场完成,即数据已经由数据交易市场以云计算的形式经过充分的处理与挖掘,由需求方直接竞价购买使用。

第四部分 对于数据交易市场的建议

目前得益于大数据这一迅猛的风口,在不同省市的政府与商界的推动下,各地数据交易中心如雨后春笋般成立。鉴于政策红利和对后续牌照发放的不确定性,先搭台后唱戏的策略实属无可厚非,但正如本文一直强调,数据交易市场的核心定位是降低交易成本,无法具备这一能力的数据交易中心在长期上是注定要被市场淘汰的。

与挂牌相比,数据交易中心的运营是更为艰难的任务,世界上也许没有第二种商品的交易会像数据那样具备想象力和创造性了,对于数据交易中心的短期发展,本文有几个不太成熟的参考建议:

1.数据交易中心首先应该围绕不涉及个人隐私的第一类数据(即统计与科研数据)入手,着力促进这些数据的交易;

2.数据交易中心需要具备专业的数据应用团队,帮助对接数据产品化问题。这个专业的团队在始创期非常关键,属于交易中的“催化剂”,以化解交易市场虽然发展了大量会员但交易量极低的尴尬;

3.设计良好的制度框架,将数据供给方的角色从“出售者”转变为“数据长期运营者”,这点上一章节已详细提及,活跃是交易市场发展的根本;

4.试错第二类数据的交易,也就是涉及到个人用户,存在一定隐私保护问题的用户特征与行为数据。

对于数据交易中心的长期发展,在于找到一套成熟的方案,能够公平合理地交易蕴含着巨大商业价值的第二类数据,这是对于数据交易中心的终极考验,也异常的困难,但倘若能做到,则未来的数据生活或许因此而改变。

第五部分 可穿戴设备与未来的数据生活

适逢今年双十一,小米推出了全新的99元的新一代小米手环。可穿戴设备已经改变了我们每一天的生活,小小的手环记录着我们每一天的生物特征与运动轨迹,而其中最为津津乐道的,是每一天晚上查看自己当天行走的步数,并在微信上与朋友们比拼。而这件事情的本质,是设备为我们提供测量服务的同时,在内部产生了相应的数据,而为了满足社交需求,我们选择将数据授权给微信,并在约法三章的情形下变成了微信运动应用的输入。

其实深入思考,其他个人数据实际与此有惊人的相似,比如运营商为我们提供通信服务的同时,产生了大量个人的通讯行为数据。这些数据作为服务的副产物,理应被放在阳光下面,只有在我们授意的情况下,才能被用于其他用途。

当然,这两者还有一个微妙的差别:手环作为一个私有物品,理应为我们毫无保留地服务;而如运营商等其他服务提供方,在为我们提供服务时,各类行为数据是属于可记可不记的数据,而运营商等花费了巨大投入,建设了企业级大型数据仓库从而能够记下这些数据。从伦理上说,对于用户而言这些数据不应该是白吃的午餐,但数据确实与用户隐私密不可分,服务提供方单方面变卖数据同样不合适,这就是数据交易的两难问题。