天云融创CEO雷涛:大数据如何改变互联网金融产品的设计思路

这个话题就牵扯到大数据怎么进入到个体端。我们看到现在的FICO,金融属性本身对个体的模型,只覆盖了3亿人。我们怎么去对这个资本进行刻划呢?我们引入了一些KLOUT的描述。你的成功不取决与你拥有什么,而取决于你认识谁。这里强调的是社会。

我怎么提炼加工社会关系呢?资本描述一个人的真实的社会资本。可以通过通话的记录,提炼出行为变量。学习互联网,应该看最核心的内容。脸谱的核心竞争力就是评价信息,谷歌的最核心是网页的质量评估体系。我们如何用这样的方式描绘人与人?我们用这样的算法,把一个省的一千四百万的用户,做了一个大排序。无需预先标识出主要人物,由算法模型来实现迭代,评估每一个人个体与群体中的社会资本。

第一个是筛选出来的,是垃圾电话制造者低跟人工标注的完全一样的,说明算法保证了非常精准的提交过程。在数据魔方里面,我们做了很多的内容。

我们看到行为数据,开始取代资产的数据,我们以前关注太多的数据,是关注含金量比较高的交易账户数据,而现在借助大数据可以处理大量的碎片化的行为。

因为我们本身的商业模式是2B的,我们在为大企业服务过程中看到内部的数据更有价值。很多人关注获取外部的数据,比如用社交数据、论坛的数据,我们发现了内部数据是启动大数据最有效的捷径。

比如说电子帐单的数据,我们以前拿到一个帐单,判断一个人是VIP还是核心的用户,看消费的金额,而现在可以基于语义分类他的消费明细,做更细化的刻画。

这是我们团队的一个博士,他自己的描述,我们把他豆瓣阅读抓下来。

在内部的数据里面,在大数据上时代上,有一个很大的变化,就是在全局和个性化两个方向的拓展。以前在小数据的时代,牛顿把苹果扔下来一定要落下来砸到他,这是经典的力学定律驱动的。近一百年都是在非常微观和宏观的世界里面,我们在突破了传统参照系的世界里做探索。大数据把我们的金融视野开阔,我们开始关注到个体,关注到全局。整个企业的资金的流转性,我们有一个全局的企业金融图谱。

我们对中小微企业放贷,也看资产负债表、利润表、现金流量表这三个表的结构,过去只能用个体历史数据与现在的比较,无法在全局的行业横切面上看。中国四千多万的中小型企业,这个过程使我们失去了全局化的度量标准,我们要拥有这种全局的视图。

个体与群众的关系,群体的智慧怎么形成?生物学家通过观察蜜蜂的行为,蜂巢的形状决定蜜巢的智慧。行为本身成为我们描绘整体事物的本身。这个行为是什么呢?我们在全局的评估里面就用复杂网络去做。我们把所有的经济往来和行为,就像蜜蜂的八字舞一样连起来。

把原来点对点的数据,做成大的网格化。这是一些截图,它事实上获得了更大的企业图谱。以前我们看供应链的金融,是在一次的偶发事件,我拿一个定单做评估替代的抵押物。现在是拿6个月的数据,描述整个的企业图谱。每个企业都量化了,这个企业跟上下游的关系链条。它是基于数据发现的。我知道上下游企业是谁。现在我们是用资金链条,发现很多小规模的链条的企业。

每一个节点与节点的关系全部量化了,做了一个大排序。这些数值计算出来做结算成本的指导依据。这个给的是绝对的坐标值,它提供的是什么?我们给餐饮行业放贷,我了解到的企业,通过供应的链条发现流通数值很高的节点,这个节点我不知道它是什么,它是每天批发胡椒、辣椒佐料给上百个火锅店。他的资金利用率是最高的。这个过程怎么量化?传统意义上是靠经验的评估结果。现在有数据的手段,通过数据本身回答,从中也发现很多的风险的问题,这四个企业实现了闭环的操作,从数据中识别出来有关联交易的可能。

数据本身是有价值的,把视野从金融的流程封装,转向金融数据产品封装,在选用数据的过程当中,不仅要考虑那些密度很高的资产性的数据,也投入视野去看行为数据,它能够客观的反映每一个C端个体客户的价值。

当我们看外部大量数据的时候,历史上自己积累的数据本身含金量很高。以前我们关注的是技术本身,信息在今天有了数据科学的改变,在二维数据结构里面,我们可以用多维去做。这样因为云计算的强计算能力以及数据科学,在结构化的数据上产生新的价值。