2014中关村大数据日于2014年12月11日在中关村举办,大会以大会以“聚合数据资产,推动产业创新”为主题,探讨数据资产管理和变现、大数据深度技术以及行业大数据应用创新和生态系统建设等等关键问题。大会还承载从政亚信府主管部门到各行各业的需求和实践中的疑问,探讨包括政府、金融、运营商等部门是如何通过数据资产管理和运营,实现转型发展和产业创新的路径。
在下午的金融@Big Data论坛上,人民银行征信中心副主任王晓蕾带来《大数据时代的金融征信》主题演讲。王晓蕾就三个问题进行交流:第一是大数据和征信之间的关系,第二是金融行业到底有什么地方可以称之为大数据,第三是大数据征信面临的问题。
以下是王晓蕾演讲的全文:
王晓蕾:大家下午好,我参加过很多会,今天这种形式有点不适应,今天是在台上站着。很高兴有机会和大家做交流大数据时代的金融征信,我跟大家交流主要有三个问题。第一是大数据和征信之间的关系,第二是金融行业到底有什么地方可以称之为大数据,第三是大数据征信面临的问题。
对于第一个问题大家清楚对于金融,特别对信贷市场来说最为关键的要解决的问题就是信息不对称,这个信息不对称指什么?指放贷机构永远没有借款人了解自己,所以最核心的就是放贷人或者放贷机构要了解借款人。欢欢讲了,他讨论完大数据和金融,发现大数据概念可以运用在金融市场上,对于一个借款的个人和企业,信息全面了解就类似于关于企业和个人的大数据。对于中国的信贷市场,对于借款人的了解尤其不够。为什么这样讲?大家可能都听过,美国有着非常发达的征信体系,征信体系里只要输入社会安全号,关于这个人的所有信息都会出来,还有一个分数。凭借这个分数就可以决定是否给他贷款,贷多少,听起来非常简单也很神话。但是事情真是这样吗?这个问题会随着我的介绍一一展开。这样的问题对中国来说大家也可能看到很多论点,包括易欢欢在内,说中国的P2P不发达最大的问题在于中国没有发达的征信体系,对这句话来说也对也不对,对的地方在哪?比如说对于我们国家来讲人民银行征信中心运行管理的个人和企业征信系统,我们搜集了8亿多人的信息,只有3亿人和银行发生过信贷关系。5亿人没有。大家清楚说这个人信用记录,信用记录,记录的到底是什么?是信用行为,什么叫信用行为?信用行为一定涉及到借钱、还钱。比如先消费后付款,这是信用。借钱为什么是信用?企业、个人、银行都好,把2万给你,把20块钱给你,让你花是信任你,前提条件是信任你,认为你一定时候之后可以还回去。所以信用记录一定记录你的信用活动,这样的话我想大家脑子往前想一步就会清楚,一定要先有信用活动,之后才有信用记录。
也就是说易欢欢他们的话不对的地方在哪?不对的在首先他看到了中国的征信体系不发达,但是没有往前进一步,为什么中国征信体系不发达。很多时候讲征信体系不发达,不如说中国的信贷市场不发达。因为你没有这种形式的信用交易,所以没有办法记录,没有行为可以记录。那么除了货币化的交易外,先消费后付款。电信,2000年我从美国过来办第一个手机很容易,身份证给他打电话,先打电话后付款,后来你们清楚电信运营商在想升级了,就是先缴费后打电话,为什么要升级?2002年,有人告诉我2002年移动电信运营商损失,就是欠缴电话费200亿,2002年的人的消费水平多高?一年当中200多亿的欠费,所以说中国的信用环境非常恶化,恶化的后果是什么?电信运营商说不伺候了,就先把钱压着。我亲身经历过这样的经历,公司高管电话打着打着没钱了,就断了,互联网公司最讲究客户体验,这样的体验好吗?不好的原因是什么?信用环境恶化。所以信用环境恶化造成了中国13亿人当中真正人家信任你,先让你消费的事情少了,这样的事情少了可记录的行为少了,信用记录自然而然少了。征信系统里可查的信息就少了。所以很多人会反过头来说这是鸡生蛋蛋生鸡的问题,但是先要有交易才能有记录。
互联网时代为什么说对于放贷人了解客户来说其实是提供了非常好的条件呢?就在于随着互联网的发展很多行为可以记录了,包括各种各样的信用行为,所以移动互联网、物联网的发展使更多行为可以记录,于是就有了更多的数据,有了更多的数据就更方便放贷人去了解客户。放贷人了解客户银行要回答三大问题,第一借款人是谁,包括企业和个人,第二问题有没有还款的意愿,第三是有没有还款能力。在座很多都是玩数据的,所以对于回答那三大问题我们的所谓的大数据,所谓的互联网都可以给我们提供非常非常好的帮助。而这些帮助可能是在原来传统的金融底下银行所不曾有的。比如说关于定位,大家经常说王晓蕾说你在征信中心上班,后来检测一下你的手机,你的手机信号从来没有到过信用中心,所以你可以在申请表填你的工作单位和地址是什么,但是你自己用的手机,这样的信息暴露了你在说假话。还有也是很神奇的事情,你说我是博士生毕业,在美国来说。但是你在互联网上,你通过机器填写申请表的时候,你的名字一概用的都是大写。后来也有数据表明,如果说你是大写,全部用大写,同事说你是博士学位毕业,这里面的造假成分非常非常高。所以说由于有了互联网很多很多的以前不可以记录的行为被记录了,于是产生了很多很多以前根本不存在的数据,那么这些数据对于放贷人以至于更广泛的人相互了解来说提供了很多新的机会。
拿中国来讲金融行业的这些大数据到底在哪里?有什么用?根据我最近一段时间的思考,我认为金融行业对于大数据应用的探索来说,可以分为宏观、中观和微观。对宏观来讲有助于提高对信贷市场规律的把握,以前我们讲数据是讲样本,现在如果说采取大数据的概念,把信贷市场上每一个借款人的行为,正如经济系统,把借款人的行为都记录下来,在全市场、全数据库的条件下可以更好的更全面的来分析,我们信贷市场上借款人行为的特征和表现。当然对这点在征信中心也有争论,一些搞统计的就说我告诉你你全量跟抽量得出的结论不会有本质差别,这种情况下我们就讲不用讨论差别,我们做出结果来比,这些事情我们也是正在进行当中。
第二大应用就是中观,加强运营管理,提高风控能力,这个是指各家银行针对自己银行的特点来利用这些数据更好的了解这家银行在市场上的竞争力。第三就是微观利用,信贷市场是一个宏观概念,但是在信贷市场上具体到每一个借款人,不管企业和个人就是一个很微观的了。开始的时候易欢欢讲大数据概念套用在单个的主体身上的时候,这些数据对于了解借款人,换句话说对借款人进行征信来说是有很大的帮助。这里说到征信的新的方式,我要特别再强调一下,对征信来说往往有两个含义,一个含义是所有的放贷人对借款人的了解,前期的静止调查和贷前调查,这种行为就是征信。对自身的征信当中有一类数据是放贷人负责需要,自然无论如何拿不到的。在座可以猜出来,这种信息就是借款人在他的竞争对手那边的交易信息,举个例子讲,就是我是工商银行的客户,同时我也是招商的客户,工商要想了解我在招商的交易情况几乎是不可能的。有人说你自己告诉工商银行不就行了嘛,这是就有一个概念就是第三方征信,征信存在的一个条件是我不相信数据主体,我不相信借款人自己告诉我的信息,所以才需要征信。在这种情况下有一类信息对放贷机构来说对借款人进行风险评估的时候比较必要但是自己又的不到,就产生了独立第三方征信,这就是我们征信中心所做的征信,独立第三方,对独立第三方征信来说我们所做的最核心的信息就是放贷人都需要,但是单个放贷人根本得不到,这是第三方征信机构最应该采集的信息。还有单个的第三方和放贷机构可以得到,但是成本很高。如果独立第三方机构来做不仅可以降低成本,还可以降低整个社会成本。
比如说法院的民事判决信息,尤其在美国来说,个人是破产的。对银行来说一定程度是不可能给一个破产的人发放新的贷款,如果要发条件应该更加的谨慎。个人破产信息从哪来?全部都在法院,在法院以什么形式存在?是在法院门口的布告栏,所以需要有第三方机构把信息抄下来,所以这个叫公开信息。我们从银行征信采集,另外一方面也在积极和各个的公共数据源的单位协商,把这些信息纳入征信系统。
如果你们注意到昨天的电视新闻,还有昨天和前天的平面媒体新闻,你们会看到人民银行征信中心和环保部和税务局、法院等等四五个机构签了协议,这些机构同意把他们产生的信息放到征信系统里来。这个的话就是在征信的一个概念,有了这个大数据的话,以前的方式基本上都是所谓的线下的,以后比如拿法院信息来说,如果各家法院都在他的门户网站把信息公开了,就不需要到每家每家法院门口去抄。通过互联网也好,或者什么方法也好就可以把信息拿到。所以就是随着数据从线上到线下,从纸质到电子,就使更多信息成为可以获得的,而且一定程度是低成本获得的。
说到银行前一段时间很多人批评银行,说银行和互联网不沾边,好象和大数据不沾边,事情真的是这样的吗?今天早晨建行的刘总跟大家交流了,下午也有交流,他有他的看法,这里是我的观察。实际上银行在过去几年,在数据的利用上面有了非常非常大的进步,银行对数据的利用和中国的金融体系发展有非常大的关系,在座的人都很年轻,你们有没有想到在1984年的时候,中国有多少家银行吗?(静止改为尽职),只有一家,叫中国人民银行,对外叫中国银行。那时候经过文化大革命,经过中央的计划经济,中国的商品经济、市场经济几乎不存在了。从1984年开始逐渐从中国银行分出来专业银行,那时候根本没有贷款概念,那时候叫拨款,类似财政拨款,当时中国的文化就是这个钱还要还吗?这个不就是给的钱吗?在此之前大家习惯是什么?计划,批条子,计划,批条子。逐渐逐渐随着商业银行法,我们的银行才开始作为一个商业化的主体存在。整个的理念也逐渐逐渐的从行政命令、批条子、关系,走向风险管理、数据分析。
之前银行对数据确实重视不够,举个例子对巨贷客户的信息,反正也不给你贷,表格往那边一扔。这几年发展很快,银行的管理以前都是一个个的帐户,拿招商银行来说,各个部门都有完整的信息,信用卡、房贷等等。最近几年从帐户管理上升为以客户为中心管理,所有王晓蕾跟银行发生的各种关系,比如跟证券或者其他的关联公司发生的关系都是统一管理。有一天当招商银行打电话说可以办我们的金葵花卡了,我说不行啊我听说你们是多少金额,如果不到还要收费。他说你怎么知道满足你的需求的?他说是综合考量了在银行的交易。所以这个吸引力是巨大的,这是银行内部的。银行外部的资料和信息也非常多,其中征信系统的信息是非常重要的一条。(巨贷拒贷)所以可以看出来银行不是说不会用数据,银行都没闲着。
如果按照刚才讲的关于企业和个人在互联网时代,所有的数据都会汇集起来,这个数据在哪呢?一个就是银行的信息,电信运营商有很多信息,还有电商平台,在电商平台的消费交易信息,还有公共互联网平台,各类在线申请平台,手机应用程序,还有公共信息。对企业也一样,银行、电商平台、供应链平台等等,很多信息如果按照以前的标准很难想象会被利用,比如财务软件,财务软件产生的信息。这些信息在以前根本没法想象到可以被利用,但是现在这些信息也逐渐被挖掘。在大数据情况下是不是降低了银行放贷机构的审贷成本呢?这个问题的话现在可能很难说,现在很难说。从道理来讲拿淘宝来说有可能是降低成本的,原因是它的平台已经存在,平台已经存在的条件下可以算编辑成本,编辑成本是低的。但是考虑到建立平台的成本在里面就很难说了,这个也是经常困扰我的一点,马云说未来阿里的的资产在数据,我对这个问题很难理解。如果你作为一个电商平台大部分的收入来自数据交易还叫电商平台吗?也许是因为我的思维太落后,跟不上时代,但是对我来说确实有这样的疑问。
在互联网大数据的情况下,像征信中心新型的独立第三方的征信有没有新的形式呢?有。现在这里讲的传统模式下像嗯新中心这种征信模式是所有的放贷机构把数据报送到征信系统里来,英文里的征信叫(英文),报告的意思。所有的放贷人把借款人的信息报送到征信中心来,这个是像传统的征信机构的模式。像我讲的还有一个非常重要的一点就是很多人从来跟放贷机构没有发生过交易关系,没有放贷机构可以把数据报给他,这些人的信息从哪来?在美国也有一种新型的模式,这种第三方的模式就是我来验证你提供的信息是正确的。所以在这种新型的征信模式底下是借款申请人自主的把可以证明他身份、证明他还款能力的信息报送到征信中心里,这类征信机构通过各种方式来合适信息的准确性。我认为这种新模式在未来的中国可能会有很大的发展潜力,原因就在于我们有太多人没有任何信贷记录和信用记录。
对于新的征信模式就出来一个问题,刚才易欢欢也讲了,有关于借款人大数据全面的,事实上就造成在互联网时代每个人都是透明的。从技术上来说完全可以成为一个毫无隐私的人,在回答隐私保护之前这里还有一个交易平等不平等的问题,在传统征信下确实对个人来说,对借款来说是让度了一些个人隐私,但是得到了更多的公平信贷交易的机会。天平是平衡的,我让了一部分隐私,这部分隐私是非常有限的,主要是借款还钱的信息。在大数据互联网下个人几乎没有任何隐私了,为了验证我身份的真实性,他可能会知道我一天24小时的定位,这种情况下这种交换还平等吗?我在跟同事讨论的时候开玩笑,我说我不过就是需要钱,这个时候我需要资金,不过想借点钱,至于把我弄得连小裤衩都不剩吗?所以这是大数据在互联网征信里要回答的第一个问题。对于借款人,我现在是需要帮助,我是需要能够有更多机会获得融资和贷款。但是这种情况下我的的确确需要把我弄得什么都不剩吗?
第二个问题才是涉及到隐私保护,消费者权利。最近国际上对这个问题的研究也是越来越热烈了。涉及到关于消费者权益保护的时候就出现两种方式,两种思考。一种是认为大数据下根本没有隐私可言,什么隐私保护政策都免谈了。另一种是正相反,各个国家对隐私保护是加强了。这是以前在传统的模式之下,传统的数据保护的模式下的一些原则,比如说建立任何一个数据库要有目的,建立数据库的目的是什么?为了达到某一个目的采集的信息要适当,不能过多,过少可能不能满足你的目的,但也不能过多,所以要适量。
也有人认为在目前的形势下,这些目的其实都很难实行了,是不是有其他的原则?这里的话我也分享一下我个人的观点,我不是技术派我不懂技术,我也不搞技术。但是我总认为技术进步是给人带来更多自由和尊严的。人类选择了状态不应该是以技术实现的极限为目标和原则,所以跟多情况技术上确实可以达到,技术确实可以让人变成透明人,但是作为一个有尊严的人类而言,那个真的是我们要选择的吗?所以其实美国和欧洲的情况已经给了我们回答,人类可以不选择这样。比如欧洲来说,拿数据保护法来说,它的数据保护法加强了,这里给出了两条修改比较明确的,在个人权利的,一个就是数据可携带权,但是有一条更重要的修改就是欧盟要把数据保护法的适用范围扩展到全世界。对于美国来说也一样,美国以前一直认为他是信息公开自由的国家,实际最近几年也加强了消费者隐私保护的立法。第三点我觉得是值得我们在座的中国的互联网新野认真考虑的问题,就是个人隐私保护的全球秩序,欧盟把它的保护法的范围拓展到全世界。换句话说如果说一个企业如果要搜集在欧洲的居民的信息,并且对外提供,你必须满足欧洲的数据保护法的要求。随着互联网的发展,国际化的发展,特别对于目前的淘宝也好,腾讯也好,微信也好,全世界都在用。(嗯新改为征信),包括中国的居民都在用,在这个过程当中对数据的保护最终只能是全球一致的。我讲这个的意思,我知道在座很多同时大数据行业的机构,我也问过他们,我说你在中国做同样的事情,你在回国前待的那个国家可以做吗?头摇的跟波浪鼓一样,不可以做、违法的,不可以做、违法的。所以说明另外一个问题,中国对个人的信息保护来说立法是严重滞后。
这一点我在业界也听到很多呼声,也希望能够有一个规则和规范,在制定中国的数据保护法的规则规范中,一方面可以借鉴国际经验,另外一方面行业自身、行业自己也是责无旁贷,很多从行业自律开始,上升到规章,最终到法律。我今天交流的内容就这么多,谢谢大家。