互联网金融的浪潮中,每一位新生军都希望把科技创新和金融业务完美融合。而作为一把利剑,数据可以改造金融的流程,定义一个新的零消费市场。
但驾驭这把利器的前提是,你需要懂得行为数据如何发挥比资产数据更大的价值,以及内部结构化数据如何在数据科学下重新资产化。这也是天云融创数据科技有限公司CEO雷涛,一直在思考的问题。
下面是雷涛在第一财经年会·互联网金融产品峰会上的演讲。
雷涛:大家下午好,很高兴有这样一个机会跟大家交流。今天我们产业互联网军跨界来到这里,希望把科技的创新和金融的业务内容融合在一起。数据怎么改造金融的流程,定义一个新的零消费市场。
我今天跟大家汇报两个内容。第一,行为数据如何发挥比资产数据更大的价值;第二,内部结构化数据如何在数据科学下重新资产化。
互联网带给我们便捷的方式和手段,使我们的交易成本变得更低,对现有的金融业务实现了更优化的配置,以更低成本的提交,发挥了互联网去媒介化的作用。这里面会形成网银、电子支付、P2P撮合交易等,其中互联网扮演了工具的角色。
我们可以看到今天的市场发生了根本的变化。
传统的金融核心的生产资料还是货币以及资产,把它作为产品化的封装。但今天我们看到数据作为新的生产资料的出现。基于消费者的行为,如在淘宝店的行为痕迹作为获取数据的基础,顾客和生产者不再对立,而这个价值就是数据。
数据搜集了以后,利用大数据技术,可以低成本汇集起来形成生产力。由流程经验驱动,逐步转向数据驱动。金融的属性更多转向风险和定价,从卖方市场向买方市场转型的,这是一个数据金融产品代替抵押物的过程。
以前的数据量很少,因为它是在已经建立了成熟系统的大型的机构里面才能够沉淀的数据。此外支撑某些业务的时的应用系统,通过交易流量产生的数据作为数据副产品。这些副产品作为数据来源的信息被加工出来。
这一块的数据含金量很高,包括支付的数据,支付的数据体量也很大。这些以前只是被作为审计的需求,现在它有新的价值的发挥,一会儿我们看一个案例。
互联网打开的第二个很大的市场空间,是在行为数据上,facebook、谷歌能够赚取较大的利润,靠的是提炼海量数据的稀释价值数据。
这两天我们召开了大规模的产业互联网,产业互联网和互联网区别是碎片化了入口,不再基于流量平台这一目前主导互联网的核心指标。
这些入口是什么呢?刚才太平洋保险讲了我们怎么计算你的生命周期表、怎么算你的寿命。我们现在跟大型的保险机构探索个性生命周期表。蕴含生命体征的行为数据,在可穿戴设备中出现。
来之前我看了一些金融里面提到的行为数据。这两天大盘反馈了一些比较好的信息,对此百度做了一个量化的算法方式,把互联网的行为、搜索框的行为引入,跟广发合作成立了一个量化指数基金。这是怎么实现的,我来剖析一下。
这是一个交易所,我们首先实现的是让海量的信息机器可读。现在已经变成机器产生数据的时代。以前可能是专业的编辑生产数据,媒体的编辑在生产数据(PGC),后来是用户在产生数据(UGC),现在进入了更海量的时代。
右边的这个部分是机器写的,像小学生一样写中心思想,把你这一段的内容抽出来,形成一个缩略。左边一个是数值,做量化,从下面期货的价格你可以看到他们之间的相关性,这些都是对数亿的碎片的信息实现量化。
量化的另一个应用是情绪判断,以前我们给大型的公司做过品牌价值。我们可以看到字的大小表示它的权重。养老是它最核心的主题,左边这个又区分出正向、负向的情绪。这些内容是做了,传统数据库在金融上无法完成的事情,就可以把品牌价值实现有效的量化。这个量化对板块而言,对投资而言,可以做很多的内容。
对于个体数据而言也是同样的,他们把我社交言论的数据也放上去了。基本上能够反馈出我们的内容,左边的数据比较多,每天都是谈工作的内容。右上角用的是hadoop模型,他刻划的这个蜘蛛图用6万5千个形容词变量五六十个性格特征描述这个人。让机器在二秒内阅读一个人的品行等。