中国IDC圈4月28日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。在28日下午举行的“大数据征信与数据流通”分论坛上,鹏元征信有限公司数据产品中心总监肖倩做了精彩的演讲
鹏元征信有限公司数据产品中心总监肖倩
以下为肖倩的演讲实录:
肖倩:感谢组委会给这次机会在这里跟大家进行交流。这次会议看到很多同行,也遇到很多老朋友,整个征信行业一直跟数据打交道,在大数据时代我们觉得征信行业也是遇到了现在时代的契机,今天要跟大家分享的主题是大数据在征信行业的应用。
第一是互联网时代下征信的特点,第二是大数据在征信中的应用,第三是征信产品及案例分享。互联网时代数据的体量非常大,整个数据是随着人们的行为在不断的被产生和记录,如果把这些数据能够很好的汇集起来,而且发生它的作用,可以成为这个时代的一个胜者,大家都在谈大数据时代有什么特点,首先数据体量非常大,数据增长很快,数据呈现的是比较碎片化的特征。这是网上的统计,大家都在提大数据,大数据有多大,有一个机构说2020年全球数据规模可能预计达到40ZB,这是什么概念,地球上所有海滩上的沙子是47倍,如果刻到光盘里是400艘航母的重量,每个人平均有5000多GB的数量级,这样的数量每年是50%左右的增长,2017年的时候中国大数据市场可能会达到8点几亿美元。
在互联网时代,数据的承载量跟以往的电子时代比起有所不同,我们现在的数据完全被我们的日常生活和工作越来越紧密的联系,我们的生活是在逐渐的被数字化和数据化,从最开始标准化程度不高,比如文档数据到后来的电子时代的音频图片视频,一直到现在跟我们生活相关联性非常高的位置数据消费数据和穿戴设备中的健康数据,这些数据都可以随时被记录利用。只要数据很好的加以利用都可以发挥数据的价值成为信用的一部分。主要看我们怎么把数据有效的进行汇集整理而且去发现它中间的一些关联关系,做到一个对过去的事件的很好的统计分析,和对未来客户行为的预测,以及对我们客户有一个比较精准的画像。这样使数据为我们整个社会来服务。如果做到这一点,他就可以被客户和整个行业所认可,也就是说,这就是我们现在所提的大数据的魅力所在。
征信是做什么的?我们是通过合法的途径在获得本人授权的情况下向第三方搜集数据,我们本身是独立的第三方机构不产生数据,所有数据来源都是第三方采集,通过征信技术手段形成征信产品,比如信用报告信用评分信用咨询的服务等等,向我们的征信使用机构提供,目的很简单,就是帮助征信使用机构防范性风险更好做到信用管理。在传统征信模式,我们认为主要发生在金融机构和征信机构,金融机构把他的信贷数据,比如银行共享给金融机构以后,金融机构获得的信息形成信用产品再共享出去。整个生态链相对比较封闭,在互联网+征信的模式下,数据覆盖范围做到一个提升,不仅仅数据仅限于金融机构包括政府电商运营商或者跟信息主体之间他们都可以作为一个数据提供,跟征信机构之间进行数据共享,征信机构形成产品以后面对全社会有征信服务需要的客户提供,不再仅仅限制与期间。互联网金融是一个火热的话题,来自于网络的统计,央行在银行数据方面已经做的非常好,去年9月份的一个统计,央行的征信系统人群覆盖收录自然人信息8亿多人,信贷记录不到4亿人,虽然总共数据占比跟全国人数占比还有差距。这是因为还存在一些门槛没有办法非常快捷的享受到信贷服务,互联网征信可以解决非银行征信的现状。所有这些现在以我们大数据为代表的IT技术实现,比如信息搜集技术存储技术大规模数据处理技术,机器学习和建模算法。