在“2013中关村大数据日”的大数据和互联网金融论坛上,由天云大数据CEO雷涛主持,与大连商品交易所的徐敦昌徐总,邦信惠融战略发展部总经理张唯聪张先生,91金融创始人许泽玮许先生,北京迈络思科技有限公司亚太区市场开发部总监刘通刘先生,大数据实验室合伙人糜万军先生,天云软件CEO张福波张先生,正德人寿保险公司CIO裴兆旭一起探讨大数据时代的金融创新。
首先第一位是大连商品交易所的徐敦昌徐总上场,然后是邦信惠融战略发展部总经理张唯聪张先生,91金融创始人许泽玮许先生,北京迈络思科技有限公司亚太区市场开发部总监刘通刘先生,大数据实验室合伙人糜万军先生,天云软件CEO张福波张先生,正德人寿保险公司CIO裴兆旭。
这次对话环节的主持人是天云大数据CEO雷涛雷先生。
雷涛:互联网金融是今年上半年是一个非常热的话题,我自己本人也看在两个阵营里面我们都在听不同的声音,像以传统金融为代表的大体量的金融实体掌控着我国主要的经济脉络,他们有自己的视角,也参与了以互联网思维为代表的新兴的思想。今天我们希望能够看到这波人,还有实验室的糜总,我觉得你可能跟政府沟通多一点,也能从第三方视角发表一下你的观点。下面更多的思想内容留给各位去谈,我想先请(赖总),不仅是从金融,而且更多是从监管市场去看,我们今天并不是从概念层面去看,无论是我们所说的,必然落脚点是相同的,从您的工作实践中可不可以给大家一些线索和思想?
:今天也是抱着一个学习的态度来参加这样一个会,今天其实前一个月淘宝,今天正好是互联网金融这样一个话题,我们是搞交易所,我们现在有13个产品,包括农产品、工业,还有,。 我这个部门,从我们以往的IT系统的建设来看,现在来看,数据这块的确有很多的新的东西,交易系统产生大的数据,这些数据需要我们进一步的去挖掘,以前传统的,,情感的数据,同时,,
雷涛:其实今天中午我们吃饭的时候提起来从监管的角度提到了一个黑天鹅现象,光大前几年的现象大家也在关注,这个事情是不是无解,因为确实正常的模型是对的,我们怎么从这个角度去发现这个模型?我们实验室的糜博士是不是可以给一些思路性的探讨?
糜万军:我是来自大数据实验室的糜万军,我们本身是希望跟创业者合作,一块能够通过大数据实验室孵化,一块建设伟大的公司。另外,我们也建立了一个平台,跟很多的院校合作,跟很多科研机构合作,我们希望做成一个能够催生出产品和人才。
雷涛:广告时间停止,我们需要答案,把你专业的知识体系贡献给观众。
糜万军:在金融方面我们做了尝试,本身我们今年通过模型做了一些直接在系统做了尝试,今年的收益非常好,所以我们也专门成立了一个基金来做这方面的工作。
雷涛:所以我们其实在中午的时候谈到了这种模型是健康的,挣钱的,但是一旦出现某一个异常信号的时候,怎么在上一个层面去做监管,这个模型出现更大的利差的时候,为什么会出现这么大的利差,是不是有外部的讲话,政策的信号发布,这对外部数据的提取或者是现有模型机制的保护?从大商所我们可以看到,很有想法,包括现在做外部数据的引入,这些东西来看,,正德保险通过裴总的这个阶段,能够把保险公司在一年之内得到巨大的提升,也是依赖于互联网,依赖于电子化的手段,下一步在大数据这块有什么想法、创新的规划?
裴兆旭:创新的规划,作为金融行业一直在关注这个新技术,很多应用是隔靴搔痒,但是大数据看了以后眼前一亮,确实是能够深入靴子里的抓手,因为我们现在金融行业IT系统作为生产线,这个是大家,尤其是我们公司重点是做人保业务,人保通,所有的业务覆盖量达到达到以上,都是电子化,。但是我们也希望开拓互联网保险,这一块如果是只从金融加上互联网这个应用效果更好,反过来要应用这种技术去挖掘互联网上的客户,所以大数据做这种社会、做这种网络,所以,这也是关注大数据行业应用的原因。
雷涛:就是您已经摆脱了企业互联网的第二个阶段已经过去了,利用。现在我们也看到在互联网企业化的过程中出现了很多新的转型,比如像马云,他用信用替代抵押品,,在保险行业出现很多,因为互联网的到来,让我们的生活和工作方式改变了,比如说网上出现的,我能不能对我游戏的资产做保险,我能不能对做保险,这些对我们品种的创新,也就是我们做IT,拿互联网或大数据技术做内部支撑以外,有没有更前瞻性的思考?
裴兆旭:其实这里有一个很关键的,就是说技术是应该有灵魂的,你是给恶魔的灵魂还是给善意的灵魂,大数据不是坏事,我们希望社会要做善事,大数据发展业务要赚钱,要能够让它做好事,这一点我们应该,其中讲到信用,其实用大数据来建立信用体系是非常有用的,而这一点是很重要的,所以金融行业。因为我们上互联网,大家都知道互联网的形态,你要想在互联网上卖产品卖得好,必须价钱要便宜,实体店卖这个价,你跟它一样的价根本卖不动,所以你必须要让利给客户,但是你要让利给客户,你一定要有地方是少收钱的。作为金融行业,尤其是保险行业在互联网这儿要想给客户让利,薄利多销的话,一定要在信用上下功夫,有了信用评分体系,有了统一的全民的电子病例,减少不对称信息的风险,这一块市场是巨大的。我们不能只讲,要抓住灵魂,用在对的路上,。
雷涛:要是有良心的话,首先要有市场监管机制,另一方面更依赖于信用基础平台。现在很多新兴的互联网金融行业都在往这个方向发展,而且他收益的方式跟传统的银行体制的收益方式不一样,所以我们也想听一听您的意见,您做一下自我介绍。
张唯聪:我是来自邦信惠融战略发展部总经理,我们在全国有25个小贷公司,专门从事小微金融行业。我们关注大数据很简单,做金融特别是贷款业务,最重要的就是寻找客户和控制风险。刚才提到大数据能帮助我们来做的就是这两件事,一个是寻找客户,我们现在全国虽然有25家网点,但是,通过互联网的精神来讲的话,我们只能服务于20%的客户,80%的长尾客户其实通过我们线下去获得不是说不行,但是成本是很高的,只有通过互联网这种渠道,还有大数据的技术,才能服务到那80%的客户,也是我们的核心客户,就是小微金融客户。而第二点来讲的话,通过中国到现在为止的这种征信体系,这80%的客户基本上是没有的,就是我们服务的很多客户都是没有征信体系的,小的企业主,比如说那种养猪或者涉农贷款的客户,他们都没有征信体系,我们如何来通过一些外部数据的使用,来控制我的贷款风险。如果是能够把贷款的风险控制住的话,同时我也通过利率上的优惠来真正服务于这些小微客户,使他们得到一个发展。这个也就是大数据对于我们公司的一个非常重要的作用。
雷涛:所以您讲到很重要的一个观点,就是我们怎么样利用互联网思维方式,将长尾这种碎片化的力量聚合,以前大企业没法去覆盖的中小企业市场,这里离不开一个核心要素,就是互联网的工具化的能力和使用的方式跟我们传统金融之间的差异性,下面就把话筒交额张福波张总,今天来的各位都不是信息化层面的,可能更多是偏向金融层面的,我们在云这个角度能用什么样的特点服务于这种长尾、服务于碎片化的需求?
张福波:我觉得如果从IT角度来说,云计算也好、大数据也好,全球哪个行业,所以你会发现在金融机构里,大数据是服务机构间的。所以,我觉得在互联网中,我们看到的一个现象,像支付宝,因为,你的IT你的服务要个性化,这样的话意味着你的IT能够在单位储存时间去解决这些问题,如果你的,所以我觉得现在IT在云计算当中能够用X86的服务器,一些昂贵的东西恰恰使得金融机构和公司能够用比较便宜的IT架构解决碎片化的东西,我觉得这是一个考虑。
第二个,面向大众市场,我们还有一个机会多的问题,我面对一千个没有问题,但是淘宝在双十一的时候,一分钟就上亿元。
雷涛:今年350亿。
张福波:对,所以我觉得在这个当中就考验我们计算的并发能力,所以现在也是为什么大规模通过计算来解决很多的能力问题,所以我觉得IT使得很困难、代价很高的问题变简单,这也是IT作为技术方面一个支撑的比较好的案例。
雷涛:非常同意您说的,刚才您举到淘宝的例子,我跟后台的一些沟通和交流,支付宝上线的过程之中,它经历了一次巨大的切换,到它后来成长到1200亿,这个过程之中,从传统的IOE架构,这个平台换成其他的肯定支撑不下去,能够到1200亿的规模前提是这里有很多核心要解决的问题,其实我们请了两家在大数据领域非常有专业技术的厂家,上午从数据角度去解读了,现在从系统角度,Hadoop作为一个有效的手段,能够承载数据融合,承载整个体系的架构,它也有一个挑战的问题,并行数据的开销和网络的开销,谁有能力优化这一块呢?这些体量从您的专业视角看,您给我们在座的业务人员提一件意见。
张唯聪:首先非常感谢雷总介绍了我们公司的东西,我今天就不再介绍公司的产品。作为一个IT公司,云计算里面它是一个比较大的平台,作为我们这种网络公司是里面更小的一个平台,讲到大数据、互联网金融这几个行业它们之间相互关联到底有多大,我作为一个厂商我不便说,在业务层面刚才几位专家已经讲到了,在金融领域,大数据会促使我们产生一些更新的金融产品,这些来源都是来源于越来越多的数据量的积累,不管你是用公司内部的,像张总提到的我们可以经营第三方的数据,无疑你所需要的数据量是越来越大的。当然,在处理这些数据的时候,我们需要发掘它的价值,我们不是把数据量大作为价值,最关键的是要发现它的价值,怎么找到它的价值?这就需要一个高效的工具。
刚才讲到Hadoop只是这个工具之一,我们讲大数据不等于Hadoop,这个大家可能也理解。如何发现它的价值,还有两个层面的意思。我们可以把以前积累的很多历史数据经过一段时间发掘出来,这是价值之一。另外有一个更大的价值,就是我们要用最快的速度响应即时的反应,就是限时、实时的反应,将来随着不同的金融产品各种种类的问世,就可以理解到这个重要性。首先我们顾及到了成本,不管你是什么样的公司,你都会在乎成本,成本是我们非常考虑的因素之一,上周我们参加一个期货行业,30%还是百分之几十的利润全部用来购买IT设备,说明金融公司不管是证券银行还是期货也好,他们还是非常在乎成本控制,可能将来走向云计算是一个趋势,还有就是投资回报率,你用的设备道理给你带来多少价值,我们吸收系统最快的给你产生一个推进和影响,所以分布式是一个投资回报率最高的解决方案,在这里有了高效的网络,我们可以让以前的Hadoop软件高效地运行,通过一些先进的网络协议,改变传统的Hadoop的速度,这是我们IT厂商能做到的,充分让大家享受到大数据的意义,我们可以提供一个高速路,让大数据跑得更快。
雷涛:非常幸运,这两天头脑激荡,我们也跟很多业内高手去谈论,还有一些POC的验证。比如在金融里头刷信用卡,以前我们要走很多您刚才提到的一个流程,我怎么能够用社团、用图计算的方式来快速的识别欺诈,这些都是新的互联网手段。我们想请您也分享一下我们在信用体系里头有没有成功的案例,就是利用互联网思路我们怎么去做信用的网络。
张唯聪:因为小贷公司是受限制的,将来会推出网络型小贷,直接通过互联网,他在线上直接注册,在注册环节就会让你提供真实个人信息的过程,比如说首先要用户名、密码,然后还有电话、或者真实姓名都要提供。通过大数据的话,我们可以做一些类似于判断它填取真实信息的时间,比如说填取一个真实的姓名,如果他花一分钟的时间去填的话,我们后台可以看到,看到这种行为的话,会做一些互联网行为分析,反推他有没有欺诈性,这是一方面。另外,也可以通过平时有些是初级客户,没有一个累计的信用体系,我们可以通过跟你协商,他允许你通过一些进入手段抓取他的一些比如说电商行为的数据秀给你看,看一下他平常通过购买电商,他有怎样的一个消费能力,来反推他贷款申请时额度上的大小。如果要是他之前没有信用卡的话,或者说他没有做过任何形式的贷款的话,可以通过平时的一些电商消费行为来反推他最终的贷款额度,来保证一个低成本的信用库。
雷涛:有太多的规则在里面,不是由数据驱动的,就请实验室大数据的专家来判断一下,真正的一个大数据项目。
糜万军:最近我去了北京、上海、武汉,这三个是国家级自主创新园区,我们讨论大数据,最核心的问题是中间体系,从这种角度来讲,尤其是我觉得在中国可能意义更加深远,尤其是对中小微企业,从国家角度,他也有这个资源,但是缺乏一个游侠的体系,尤其是上海张江,园区的人很少,没有一个系统的方法是很难做到的。所以现在这三个园还有很多园都在花很大的精力做这个事。
裴兆旭:其实这里头治病根的地方就是一定要建立一个信用评分体,如果每一个人、每一个企业都有一个评分机制的话就一目了然,你就不用算了。
雷涛:这个评分跟现在的评分体系有什么差异,现在结构化的思路也在做。
裴兆旭:美国是商业化,它已经用商业化和技术手段结合,在没有大数据的时候我们走到今天这个地步,这是一个很好的管理智慧,金融管理智慧所制造的一个产品,我们可以借鉴,我们不用自己再去摸,摸到最后你可能摸了半天重新设计一个轮子比人家设计得还差,要借鉴它。中国有一个优点,我们是政府采取行动的,央行、社保相关的机构配合起来,公安部都配合,这块如果联合起来,大家用开放的心态为事情做事情,由央行牵头做这个事情可以做得很好,然后把评分做起来,金融企业去用,小贷公司做研发多累,成本多高,保险公司一家自己去做,很难以偏概全,你做大数据就想让他抽样,你想把它做准确,失之毫厘,差之千里,还不如几个机构汇聚起来,做一个信用评分体系,这个信用评分体系一旦形成了以后,他去贷款买房子、买车、借钱,甚至去申请学校、申请工作,都会有影响的话,这个社会的每个人都会建立在信用的基础上。
雷涛:这个手段掌握在谁手里?还是传统监管部门的手里?
裴兆旭:我觉得这个事情不要等监管部门,等的结果越等越糟,我觉得媒体、科技公司、互联网公司、金融机构都有责任,我们可以去呼吁。我上次跟京东的一个副总裁聊的时候,他就说他不相信这个,我们可以自己形成一个商业产业去做,比如说金融产业自己想办法去做,小贷公司、保险公司、银行,银行自己有内部的信用,但是太小、太片面,这些都不够,我们要尽量的全。但是这里有一点,就是这个里面的道德底线,风险管理和隐私管理必须有相关的规定,你不能让他做坏事,你只要一做坏事,大家就会抵触他,这就形成了对抗,这一对抗下来效果就不好,就是要把它管理成一个对大家有利的事情,我们都要去推动,因为这个回过头来会让社会在做互联网金融薄利多销的时候有一个很好的参数,要不然自己做你怎么弄都是不准的。
雷涛:现在已经出现了,我看到一些商业形态,越来越多的小贷公司出现,他没有数据,就开始向一些传统经营企业购买数据,传统经营企业又出现了一个新的平台。
裴兆旭:还是片面的,还是不够的,其实这个东西要做好需要各种数据,不是贷款的数据,交水电费的数据,闯红灯的数据,这些都都有。
雷涛:刚才您提到一些数据都是它的显性价值,这些显性价值拿来我们思考一下可以作为一个模型和评估体系,其实在金融企业里也有很多沉淀的金矿,他有pos刷卡数据,每一个实体与实体,这个商店和那个商店之间实际上是通过人作为一个连接起来的,可以把这个依赖关系建立起来。我这500个商家所获取的是一个,500以后又是另一个,所以每刷一个传播的信用激励也是通过原有的数据加工出来的,这一点我想徐总这边应该也有思考,怎么充分帮助他们实现交易呢?
徐敦昌:刚才大家都说到了,如果社会把这些全部关联起来,才能够完成这个过程,让它向良性方向发展。
雷涛:下面我想留几分钟的时间,大家有什么样的问题对在座的产业的代表,或者是跟行业的客户代表有什么样的想法和问题,我们把话筒交给在座的各位,谁愿意提一个问题。
提问:我提一个问题,刚才我没记住台上老总说我们要建立一个统一体系,不管是用数据分析还是怎么样,但是我在想,人是一个复杂的,非常复杂,这个人走路很正常,也不闯红灯也不干吗,但是他开车以后非常喜欢飙车,你要是做一个单一的不管是评级还是考核还是什么的,得出来的结论可能跟怎么实际需要的不一样,比如说你去贷款,你去考核他是不是飙车或者是闯红灯,一个是遵守规则,一个是不遵守规则,你赋什么样的权重?我个人理解是不是应该开放一些,本来大数据带来的理念是一种新的生态系统的构建,而不是简单的统一标准化的,标准化的是西方的思维方式。请你们谈谈怎么理解到底从根上从思维上怎么促成这种转变,一种产品带来的影响很小,我更希望听到大家关于更深层次的推动作用。谢谢!
雷涛:你提的是建议,不是问题。
糜万军:现在有这种趋势,很多数据原因是很分散的,它以API的形式来提供,我的理解是集中和分散这两个趋势并存。
张唯聪:我觉得大数据对于金融来讲、对于风险控制来讲,关键是预测,它只是一个辅助手段,最终还是人定。它有多大比例呢?我会找之前飙过车的,贷款没还的人有多少,如果他比例很高,我会把他淘汰掉。
雷涛:现在其实是多样性并存的,淘宝也没有为你每一次购买购物给你定一个策略,我每一次购物的时候,这个信息和这个东西匹配上了,大数据更多的面向匹配操作。
裴兆旭:其实这个过程,你讲的话,东方西方并不认同,美国是有落地的办法的,人家从最基本的东西开始,就像你小学学算数1+1等于2,到中学学微积分一样,这是一个过程,不可能一下子从1+1跳到微积分。他们已经有一个过程在走,科学没有国家的区别,它是科学。所以,我们这里特别要注重的是什么呢?我只是只拿超车的数据来看,它一是个方面围度,你交不交水电费是一个围度,你有没有杀过人是另一个围度,就是要尽量越权,而且很重要一点,从基本的统计到建模到预测再到规范,其实我们整个的体系最重要的是规范,我要搜集权、我要建模、我要预测行为,所有的数据都是过去的,没有未来的,怎么样弄未来的,抓住他内心的心理动机,如果他心理动机就想犯罪,这个人一定会排除掉,但如果这个人是一个正常人比较粗粗拉拉的,我在美国遇到一些年轻人以前刷卡就拖欠不还,后来他发现信用太差,对他不利,然后就开始修补信用,以后交费按时,这就是好事,我们要的是这个,其实这是最重要的。我们先要统计、搜集、预测,还要规范,要达到这个,整个社会就往良性化循环了。
雷涛:您的问题有三个观点在回答您,从互联网金融小贷公司的,和从传统最正统的饱受企业的,还有代表我们技术的思想。下面还有什么样的问题?也欢迎大家再问最后一个问题。
提问:这个有没有机构在做?
裴兆旭:非常复杂,这是一个很好的商业竞争的环境,它有数据服务公司,我觉得在中国互联网公司也可以走向这种服务公司,金融机构和各个行业,我们不鼓励所有人为了喝牛奶就去养牛,成本太高了,应该有专业的养牛场,我希望这个事情走到这个地步。但是现在没有专业的,所以大家自己都在养牛。
张福波:实际上在美国和加拿大,他们的后台数据是空的,我举个例子来说,曾经到银行去办一件事情银行说你有一个信用拒绝的记录,我说我从来没有被拒绝过,后来他提醒,我想起来,原来我帮助朋友去汽车行贷款买车的时候做了担保,正好我那辆车也在担保状态,他说你一个人不能担保两辆车,后来我比较吃惊,这个社会体系能不能把这个数据在后台连通起来,连通起来数据越多,我觉得数据永远不怕多,数据越多,信息会越完备,上海曾经也做过信用体系,当一个信用体系只要有数据缺失的话,其他所有的信息全是正确的,你根本不知道他的犯罪记录的话,实际上还是不准的,所以我觉得这确确实实是一个系统工程。这是我的看法。