这里需要说明的是,本文中的个人数据领域,并非交易已经充分匿名化的个人数据,而是带有用于找出这个用户的虚拟用户身份标识的个人数据。否则哪怕数据再有内涵,无法定位到用户并转变为营销与洞察,这类数据都是难有有武之地的,但保留用户身份标识又涉及到了隐私保护的问题,难度就在于此。
为什么需要把数据交易分为非隐私数据交易,以及个人数据交易这两种类别分开观察?因为这两类数据实际有很明显的特征区别——
首先在应用难度上,个人数据比非隐私数据简单很多。比如获取了一组带有用户显性标识(如手机号、邮箱等)的最近加入购物车商品偏好数据后,就能够很容易将之用于精确营销,但如果拿到的是匿名的区域性电商交易统计数据,则需要使用大量的统计分析工具,才能将其用于如商机分析等应用(例如淘宝“数据魔方”产品),而至于其他信息量不怎么丰富的非隐私数据(如城市出行规律数据),要挖掘其中的价值就更要破费心思了。
其次从应用价值上,非隐私数据由于经过了大量的统计汇总及匿名化处理,往往大部分数据的信息量将会显著失真。而个人数据是公认价值巨大的数据,以至于出现各种数据黑市盗卖个人信息,如果这些数据能被应用于阳光之下,其价值更加不可小觑。关于个人数据的巨大价值潜力,在本文第二部分还会进一步分析。
从交易难度上,非隐私数据交易非常简单,因为非隐私数据通常具备明晰的所有权,并且不存在用户隐私问题,可直接交易,但个人数据存在棘手的用户隐私问题,要将其放在阳光下交易的难度,不言自明。
从定价方式上,《数据交易史话:隐私、定价、交易与策略初探》一文有详细论述到这两种数据的定价方式,非隐私数据可使用简单供给方挂牌定价的方式就够了,但个人数据由于价值差异性巨大,可能需采取需求方定价等复杂定价方式,难度同样不可相提并论。
通过上述分析可以得到一个易见的事实,就是非隐私数据虽然应用价值不如个人数据,又具有应用难度较大的缺点,但由于具备交易难度低、定价简单两个黄金优势,势必将成为数据交易当前重点布局的类型,只要能一定程度克服应用难度偏高这个缺点即可。
理想的非隐私数据交易,是将其定位于数据服务,并非是简单的原始数据交易。交易平台除了需要具备广阔的数据目录以外,还需要具备优越的数据运营、咨询能力。有一个具启发性的思路就是,数据交易中心可借鉴手机应用商店做法,设计激励政策将数据供给方的角色从“出售者”转变为“数据长期运营者”——鼓励供给方不断维护、升级所提供的数据,比如勘误、定期更新数据(类似应用商店中的版本管理),激励手段举例如给予活跃维护数据的供给方的数据产品提供在平台上更多的曝光、平台扣起部分收入根据购买者售后投诉情况做备用赔付金等。从此以往,数据需求方不再是花钱“购买数据”而是“订阅数据”,从而不仅能减少提供方以次充好捞一票就走的行为,也更能体现交易对象是数据服务的本质。
围绕非隐私数据的交易以及相关数据服务,或会让部分数据交易中心走上专业化的路径,如专业金融数据及服务交易机构,因为非隐私数据的特征注定了每个需求方使用原始数据挖掘价值的方式是不经济的,业态可能是以提供特定领域数据服务为主的专业数据交易中心,或数据交易中心+专业数据服务机构绑定的联合。
例如被华尔街视为眼中钉的科技公司Kensho。Kensho将大量的经济运行数据、金融交易数据、政治信息以及通过复杂的金融模型运算,可以像Google一样以简单方式提供答案,比如苹果发布iPhone 7以后哪些股票将涨。美国著名能源监控公司Genscape采用热成像镜头分析油罐中原油存储量、实时监控北美发电厂停机状态等方式收集大量能源数据,并将数据制作为原油、电力和天然气等咨询报告,广泛出售给华尔街等投行客户。
因此,数据交易中心不能单纯聚焦于扩充数据目录的“圈地运动”,在缺乏数据服务深耕的布局下或许很难走远,非隐私数据交易的最佳形式是走数据服务/咨询报告。
上述讨论的范畴主要集中于非隐私数据的交易,而个人数据(个人明细的行为/特征数据)的交易存在极为棘手的隐私、定价问题,但其成功交易与流通将能爆发出更为耀眼夺目的价值。为什么如此说?这要从一种全新的生产形态——反馈经济说起。