亚信数据胡嘉琪:数据交易史话2

导读

本文承接《数据交易史话:隐私、定价、交易与策略初探》(原文链接:http://www.china-cloud.com/yunjishu/shujuzhongxin/20160108_47763.html),试图探索未来数据交易业态的构成,全文将由以下的核心观点穿插而成:

1.数据的交易可分为非隐私数据以及个人数据交易两部分,近期数据交易中心需聚焦于激活非隐私数据交易的模式;

2.非隐私数据的交易破局,需跳出数据“圈地运动”,走数据服务/咨询报告形式;

3.个人数据的交易与反馈经济模式息息相关;

4.“无授权不交易”——个人数据的交易前提是数据所有权的明晰,需要得到用户授权;

5.反馈经济下的个人数据交易,或导致产业数据交换联盟这种致力于产业内/间数据交换、及充当低成本数据流通的组织出现;

6.个人数据交易可进一步分为个人特征(Profile)数据,以及代表了潜在可反馈需求的行为事件(Event)数据两种交换形态;

7.产业数据交换联盟将作为反馈经济模式下的需求路由,致力于个人用户行为事件(Event)数据在联盟内部的流通交易;

8.个人征信的外延有可能扩大,成为首类产业数据交换联盟之一;

数据交易模式未来演进的可能性,是一个炙手可热、同时扑朔迷离的话题,本文坚持需要分为非隐私数据交易,以及个人数据交易这两种类别分开观察。前者难度集中于价值挖掘,而后者是隐私与定价问题,两者相比,后者成功流通的价值无疑更大,个人数据交易与反馈经济这种全新的经济模式有着千丝万缕的关联。本文试图理顺这种关联并构想出一种可能的个人数据交易/流通模式,鉴于其中的难度,本文的观点难免存在种种不完善之处,希望对未来的数据交易探索有启发之用。

第一部分 数据“圈地运动”

随着发改委《组织实施促进大数据发展重大工程的通知》的发出,大数据产业进入全面政策利好时期。在不久的将来,在数据交易方面会迎来更深布局,更多数据交易机构将萌生。

数据的大范围流通与交易将会成为将来大数据产业的主要业态之一,而数据交易中心则是其中的重要枢纽。而对于数据交易中心而言,最为迫切及显而易见的工作,无疑是快速扩充自身的数据目录——作为一个专业的数据交易机构,核心价值毫无疑问首先在于所掌握的数据资源数量。为此,最为简单粗暴的方式,就是利用数据交易中心自身的资源,在政府、商界等触手能延伸到的领域获取数据目录,甚至签下排他性协议为佳。或者出台“数据孵化”机制,实质上让大量质量难以保证的数据进入到目录之中。

而这犹如历史上的“圈地运动”,虽能为数据交易中心完成原始数据资本的积累,但却难以有效推动数据交易市场的真实交易量。这里我们以国内政府数据共享开放做得相对比较好的上海市政府数据服务网(www.datashanghai.gov.cn)为例。上海市政府数据服务网是国内政府数据开放的标杆,上面总计发布了401个共享数据集,数量之多、覆盖之广在政府数据开放领域无疑是开创先河的,也充分反映了上海政府在这方面的努力和诚意。但客观而言,我们发现大部分为开放的数据为静态数据,数据虽然有管理主体(发布的各级部门)但缺乏有效的运营与管理,大量数据几乎半年、一年都未得到更新。另外数据类型多以如机构信息等POI数据、宏观经济数据、政务文件数据以及气象环境数据为主,一些数据难免有鸡肋之感。即使抛开数据标准不一等技术问题,但若要深入挖掘其中的价值,尤其是在商业层面价值显得不怎么容易。

上海市政府数据服务网(www.datashanghai.gov.cn)

数据“圈地运动”虽然能快速扩充数据目录的广度,但缺乏“优生优育”的数据,往往在价值对接中存在巨大的难度,造成了面前是数据的汪洋大海但仍然难取一瓢的遗憾。

在本人另外一文《数据交易史话:隐私、定价、交易与策略初探》中,提到了数据大致可以分为两类,第一类数据,是不涉及任何个人隐私的统计性与科研数据,为求直观,本文接下来先姑且称为非隐私数据。而非隐私数据正是当前数据交易所主要收集数据种类;而第二类数据,是形成了“四方问题”闭环的明细用户特征与行为数据,本文接下来简称为个人数据。这类数据的特点是由于涉及到个体用户的行为与兴趣,蕴含着巨大的商业价值,但也直接涉及了用户的隐私,当前直接交易存在几乎不可逾越的鸿沟。