数据API经济与大规模数据流通:从水的寓言说起

问题三:不具备丰富的计费模块,无法实现差异化数据定价。当前数据API提供商在计费模式上,基本采取小流量查询按次计费,部分包量查询(如xx元xx次),大流量查询(大客户)线下议价的方式进行。但事实上数据交易与流通的定价与计费是非常复杂的一个课题,原因在于数据具有错综复杂的价值相对性,对于主体A一文不值的数据,放到主体B那里则犹如金子般珍贵。将来随着数据API经济进入爆发式增长时期,可以预见,灵活计费、对数据进行差异性定价将会成为数据API运营的一大重要抓手,数据API运营平台甚至需要具备类似电信运营商计费系统的复杂计费能力,才能有效匹配数据API经济的发展。

由于集众多优点于一身,数据API将会成为数据大规模交易与流通的重要方式,甚至是将来数据流通的事实标准。但从目前数据API实践来看仍存在众多问题,究其原因,主要在于目前数据API接口这件事情本身被大家定位为数据交换的技术手段,并未更深入去耦合各种数据交易典型场景,如隐私保护、鉴权与计费,但这些场景元素在数据交易中是必不可少的甚至是前提条件,它们的缺席将催生大量如“洗数”等乱象,就如开篇寓言故事中无序发展的自来水市场。而这时候需要有一套权威的数据API交换标准,正如故事中国王的强制性自来水标准,让数据API经济在深思熟虑的顶层设计下运行。而这套权威的数据API交换标准,本文先暂时称为“增强型数据交换导向API”,即EDO-API(Enhance Data-exchange Oriented Application Program interface)。

增强型数据交换导向API与大规模数据流通

增强型数据交换导向API,即EDO-API是本文提出的创新概念,其目的是以技术为核心驱动力,旨在完善现在基于数据API接口的数据交易与流通中的种种不足,并整合为一套具备权威性的数据API流通标准性接口产品。具体设计上应高度耦合关键性数据交易元素,至少解决以下问题:

智能数据鉴权能力--EDO-API作为数据交换标准,提供智能化数据鉴权能力,杜绝将灰色数据加工为数据API服务的“洗数”行为。诚然,数据鉴权是个复杂性问题,尤其是在个人数据盗卖已成完整产业链的当今,防范数据API被作为灰色数据洗白变现的窗口实际上是个很有难度的事情。科学鉴权需要涉及到完备的数据源审核流程与认证体系,EDO-API需要具备这样的模块,从而保障认证的数据流通于阳光之下,而其中的市场价值也是显而易见的。

个人隐私数据查询授权功能--数据鉴权是为了杜绝灰色数据的洗白变现,而在数据API经济中,正规的个人类查询数据在获得授权下是应该允许流通交易的,正如央行个人征信数据在获得当事人授权后允许第三方查询。EDO-API里面,可内嵌一套个人用户授权IT解决方案,如标准化个人数据查询授权电子协议接口,互联网金融机构可将这份电子协议嵌入自身的用户协议中,用户同意后将生成一个授权token,允许这家机构通过EDO-API查询电子协议中用户授权范围内的个人数据。

综合性计费模块--上文已经论述过为什么说丰富的计费模式对于数据的交易与流通将具备极其重要的意义,另外有效运营是数据API经济中不可或缺的核心抓手,而运营离不开的是大而丰富的盈利模式,而盈利模式在IT端则反映为计费问题。如何通过强大的计费系统去支撑数据API经济的有效运营,如支持各种API调用次数的阶梯包月套餐、查询费用促销(打折、限免)、闲时流量(鼓励用户在API提供方服务器并发量低时查询),甚至创新性的按实际数据效果付费等收费方式,是EDO-API需要提供的一个核心能力。

总体而言,EDO-API需要搭建一套规范性的数据流通环境标准,同时提供计费、数据隐私保护及数据安全等一系列中间件,可以迅速帮助企业主体建立完善的数据开放与流通的环境,大幅度降低数据提供方的部署成本以及需求方的交易成本,从而形成完善的数据交易与流通生态系统,支撑数据API经济的未来。正如故事中国王的强制性自来水标准,数据的大规模流通,特别是数据API经济也需要一套标准,这就是EDO-API的定位。目前市场上缺的从来不是数据,而是让数据交易在阳光下流通的标准方法。

最后,简单谈谈数据交易标准以及我们亚信的Datahub

目前已经有一些机构在推动数据交易标准的建立,但我认为数据交易标准不应该仅仅是一纸文档或者行政命令,而是一套能真正解决市场中数据交易问题的技术性标准。正如我们回顾互联网流量交易的发展,可以发现真正的推动力量并不是各种乱七八糟的广告联盟公约、广告投放标准,而是扎扎实实的流量交易技术,比如计算点击率的大规模并行逻辑回归、反作弊引擎。正是这些接地气、能解决流量交易实际业务问题的技术所构成的整体交易架构,才是真正的交易标准。--我们看到百度、谷歌等都用类似的技术架构在运营广告,这是技术使然。