王晓蕾认为,互联网记录了借款人以前不可记录的行为,获得了以前无法、或成本很高的数据,有利于为放贷人了解借款人是谁、有没有还款能力和还款意愿提供了新的渠道和方法。但是,相关的信息究竟如何使用有待进一步研究验证。
王晓蕾引用2014年美国政策与经济研究委员会(PERC)的一项研究结果称,非金融信息在信贷决策中的作用有限。例如,研究就初步发现,社交信息对于判断借款人的还款意愿和能力暂无预测力。
“而诸如水、电、煤、有线电视、手机等非金融信息纳入征信系统,显著地提高了薄信用档案人群的信贷获得能力,但对于厚信用档案人群而言边际作用不大。”她表示。
“只有好样本,没有坏样本是无法建立有效的信用评估机制。” 宜信至诚征信的董事总经理赵卉表示,电商、支付、社交等数据只能作为信贷审核的参考值,而贷后数据才是强参数。
对于这种论断,互联网公司们显然是不赞同的。
腾讯征信总经理吴丹告诉记者,从这段时间内测的结果来看,在模型中加入社交数据以后,对它的风控能力有20%—25%的提升,尤其在小额贷款领域。因为,通常一笔几百块的借款,违约发生的原因不在于借款人的还款能力而是意愿。
俞吴杰表示,通过大量的研究证明,人的行为数据和他的信用有直接关联,因为行为很难撒谎。从这段时间公测的结果来看,用户的芝麻分越高,其贷款的违约率越低,二者呈单调、线性的关系,这也证明了芝麻分在信用评估上的有效性。
不过, 仅仅依靠互联网上的数据并不足以建立一个强大的信用评估体系。显然,所有大数据征信的市场参与者都深知这一点。“在未来,把传统数据和创新数据结合到一起,一定是我们要到达的终点。”芝麻信用的总经理胡滔如此总结到。
顾凌云告诉记者,风控模型本质上还是对一个人金融还贷能力的预测和评估,所以,尽管Zest Finance大量采用非传统的信用数据,但在大部分的风险评估模型中,传统的信用数据(银行信贷数据)依然占有一定的比重,平均也在40%左右。
三. 解码大数据征信:谁会成为中国版“FICO”
大数据征信导出产品的方式之一是构建一个可被广泛采用的信用评分体系,而从国外的经验来看,通过评分而不是数据报告的方式呈现征信结果,也是一个解决隐私保护问题最好的途径。
因此,目前多家机构都率先推出了各自的信用评分体系。例如,芝麻征信的“芝麻分”、华道征信的“猪猪分”、拉卡拉征信的“考拉分”、前海征信的“好信度”、腾讯京东金融的“白度”、拍拍贷的“魔镜分”、腾讯的信用星等。
从呈现方式来看各不相同,例如,“芝麻分”的范围在350分到950分之间,分数越高代表信用程度越好;“白度”则是从0到100度;腾讯的信用评分则沿用QQ体系的习惯,用星级而非数字体现,七颗星为最高信用级别。
但比FICO“野心”更大的是,中国的个人征信机构正试图把信用评分体系的应用范畴从金融领域扩展到生活领域,从租车、租房,到婚恋、求职等等。甚至,它们希望从改变大众对信用的认知到提升社会的信用体系。
谁能打破数据孤岛
在谈及征信业务的发展时,大部分接受《第一财经日报》采访的人士都提到了FICO分。尽管中美两地的征信市场存有差异,但像FICO一样形成一种被普遍采用,并具有行业标准价值的信用评分体系却是各家征信机构都在努力的方向。
事实上,作为美国著名的个人消费信用评估公司,FICO本身并非一家征信公司,而是提供决策和分析管理技术的第三方服务机构。由于美国三大信用局都使用FICO分,每一份信用报告上都附有FICO分,以致它几乎成为信用分的代名词。
FICO中国区总裁陈建在接受本报专访时表示,中国不缺数据,不管是阿里的电商数据,还是腾讯的社交数据都是可靠、大量且真实的,对于刻画消费者的特征、风险有很好的作用,但是目前中国还没有除央行以外很好的评分体系。
在他看来,中国建立一个全民评分体系的挑战在于:个人征信市场刚刚放开,很多数据源之间还是一个相对封闭的“孤岛”,例如传统金融机构与互联网公司之间是基本隔离的两套体系,每一家互联网公司之间又是各自独立的一套体系。