大数据跑马圈地的时代已过 逐渐清晰的产业格局将上演“厮杀”

所以说,大数据在金融业的作用已经得到了证实。

除了金融行业,其实大数据在更多的领域预测都有过很好的效果,长尾效应的改善,交通拥堵的预警,自然灾难的预测,等等。

早在80年代,翁文波老先生就预测到了91年华东、华中的那场特大洪水。这个预测发布在1984年出版的《预测论基础》一书的第125页,当时并没有引起人们的注意。七年后,一场特大洪涝灾害袭击了华东、华中广大地区,这才有人想起,一位石油科学家对这场洪水早有预料。

在天灾预测中,翁文波对天文学中的可公度性给予了特别关注。翁文波认为,可公度性并不是偶然的,它是自然界的一种秩序,因而是一种信息系。可公度性不仅存在于天体运动中,也存在于地球上的自然现象中。

大数据是有用的,只是很多价值还需要我们不断地去探索,开发。在很多应用场景里,不要只过于关心数据是否“大”,同样还要关心数据的挖掘,因为只有对数据的深加工,才能发现很多隐藏在表象下面的“真相”。

 大数据能赚钱吗

近几年来不知是由于经济下滑,还是物极必反,人们已经很排斥纯粹烧钱的模式。能否“变现”,也成了衡量一个项目好坏的标准。

在一次演讲会上,美国大数据领域超人Nate Silver对台下众多企盼得到成功秘笈的听众们坦言,“我的成功你没法复制”。这也是整个行业的缩影。大数据项目虽然横跨了多个领域,但真正在一个行业或者一个领域内取得巨大成功的创业公司还是凤毛麟角;而且,这些为数不多的企业,之所以取得成功还夹杂着这样或那样的“偶然”因素,别人根本无法复制他们的成功模式。

既然成功模式还无法复制,那我们退一步,来看看产业链中都有哪些环节,你在整个产业链中可能会扮演什么角色?我们以北美目前最为成熟的数字广告业(目前被公认的为数不多的成熟大数据项目)为例,来说明大数据产业中可能的几种角色。

数字广告产业链看大数据格局

从这幅图中我们可以看出,整个大数据产业链,可以分成这样四种角色:数据提供商,算法提供商,数据优化提供商和应用提供商。

数据提供商

一般都是由于拥有某种入口资源,经过了数年,甚至十数年的积累,形成了在某一领域,某一行业独特的数据资源优势。数据提供商可以将数据提供给第三方使用,从而将资源优势转化,形成实际的收益。由于分工的细化,数据提供商未必自己去做产业链的其它角色。当然,随着数据成本的日益增高,数据将越来越汇聚到几家巨头手里,而形成几家数据寡头为中心,数家各领域,各行业垄断为补充的格局。

举个最简单的例子,按照身边几家数据公司最多的融资(注意是融资,不是估值!),4亿人民币,如果想打通某项数据,需要去外部购买,每条信息1元,买4亿个用户的数据,资金链就断了,又得融下一轮了;而现在1元钱,根本买不到足够数量和质量的数据。

所以说,数据提供商是讲出身的,你没有入口资源,还是不要去妄想成为这一角色了吧。

算法提供商

这一角色可以没有数据,但必须要拥有很强的算法能力和行业的背景。目前在各个行业都有一些独立的第三方算法服务提供商。这些企业虽然没有数据,但具有行业丰富的经验和背景,可以为客户提供很好的算法服务。

单纯有算法,没有行业的背景,没有对行业的了解是不够的。再好的模型,没有行业的最佳实践,没有对行业的深邃洞察力,没有经验的积累也只能是纸上谈兵。

数据优化提供商

这一角色一般也没有足够的数据源。属于整个产业链比较尴尬的角色,有点像生产线上的技术工人。它需要从数据提供方买来数据(或者由需求方提供数据),然后按照需求方的要求,将数据整理、优化,交付给甲方。至于甲方如何来使用,它并不介入。数据优化提供商既没有足够的数据资源,又没有算法提供商强大的算法和行业洞察能力,所以只能做些低附加值的技术劳务输出。

应用提供商

这一角色又叫解决方案提供商,是离客户最近的一个环节,也是最能体现价值的一个环节。

对客户而言,他并不关心大数据到底有多大,数据是否足够优化,算法是否足够科学;他关心的是,是否能给他解决实际的问题。