从2012年的“用户标签”到2014年的“用户画像”,从2015年的“大数据”到2017年的“人工智能”,大数据正在从神坛走向现实。
“标签”到“画像”,代表着数据在数量和维度上,逐渐在丰富:“大数据”到“人工智能”,表明从原始数据到本体认知的过渡。
无论是数据积累的量变到质变,还是数据到认知层面的过渡,大数据已经开始在一些特定领域和场景下为客户解决实际问题,创造价值。
本文将从产业链、市场、误区、挑战四个部分对大数据市场现状以及下一步的发展提出自己的观点与洞察。
产业链
在2017年初的时候,根据产业的发展我将2016年认为的产业链中四个环节压缩至了两个,即数据服务平台提供商和数据解决方案提供商。
(图片说明:实际的产业链以及2018年可能的演进)
通过过去一年的观察发现,虽然市场上确实以这两种角色为主体,但在具体项目中,这二者并没有形成上下游产业链的局面。在一些行业市场中,数据服务平台提供商向前跨越,直接面对行业客户,向他们提供其所拥有的外部数据(往往本身就拥有海量的2C数据入口,可以源源不断地生产2C数据)的粗加工产品(如用户的标签数据等);而在另一部分行业市场中,数据解决方案提供商,基本使用用户自身的数据,通过数据处理服务,为行业客户提供某个方向的解决方案。
上面两个角色之间基本没有合作、没有交集,很少在市场上直接竞争。
究其原因,个人认为有两个方面。一个是市场的成熟度决定的,还有一个就是由法律或者说政策环境决定的。
首先,这是由市场的成熟度决定的。目前行业应用市场还处于早期,部分行业用户的需求集中在外部数据的简单加工层面,还没有渗透到行业纵深,与行业的核心业务没有形成深度耦合,对数据服务提供商还没有很深的行业经验要求;另一方面,现阶段大多数“解决方案”提供商,基本采用客户自身的数据,依靠数据处理能力为客户提供数据集成服务。现在的“解决方案”提供商,大多还停留在数据服务的层面,并没有大量应用外部数据的经验,与行业的深度需求耦合还远远不够,自然也没有形成“杀手”级的产品,行业的可替代性很强,与数据服务平台提供商的能力差异并没有充分表现出来。这些,都从不同程度,反映了市场发展成熟度不足的问题。
其次,数据的交易目前在我国还是一个敏感的话题。虽然数据服务平台提供商拥有海量的2C数据,可如何与第三方合作,为行业客户提供他们所需要的解决方案,还是个无法触碰的禁区。6月1日生效的个人隐私安全法(下面简称隐私法),只说明了“干什么”不行,但并没有规定“如何做”才是可以的。而这个“如何做”才行的体系,需要经过几年时间的建立才可能完成。法律环境的滞后,也限制了行业的进一步发展,资源将进一步向掌握数据的巨头集中。虽然这样做便于管理,数据集中在几个巨头手里好监管,不会产生隐私数据满天飞的乱象,但缺点也是显而易见的。数据无法打通,就会形成一个个信息孤岛;数据无法流动,就使数据应用受到很大局限。这一点,恐怕是监管部门最应该尽快解决的问题。
百行征信的出现从某一个角度说明了解决这个问题的必要。
(图片说明:实际的产业链以及2018年可能的演进)
上图的上半段就是现在实际的产业链情况,而下半段是根据现在市场发展的态势。我认为2018年可能会出现的演进。随着大数据被应用到各行各业,大多数行业的数据准备并不充分,数据基础薄弱。要想使数据产生价值,发挥更大的作用,势必需要大量的数据归集与治理,这就是数据优化商的角色。由于增量市场的出现,仅靠现有的解决方案提供商和数据服务平台提供商自身的力量是不够的,这就为独立的第三方数据优化商出现,并存在创造了客观上的空间。所以说,对于大多数行业而言,要想充分发挥数据的价值,首先要从数据的归集与治理开始,磨刀不误砍柴工!