从淘宝的 “花呗” 到京东的 “京东白条”,再到芝麻科技旗下针对线下零售门店推出的实时导购助手 “知了”、结合了线下商业消费数据及线上消费轨迹的 “观星”,似乎大数据还被禁锢在互联网企业的圈子内。互联网大数据在于掌握了许多传统数据方及征信方拿不到的数据,例如在国外,已经有公司在分析用户的 Facebook、LinkedIn 和 Twitter 账户来评估他们的信用情况。包括美国的企业征信巨头邓白氏近年的战略主要有二:增强数据挖掘能力,兼并掌握技术的企业;与互联网数据掌控方战略合作,共享数据。
今年6月,浦发银行信用卡中心宣布与腾讯征信开展合作,借助互联网大数据对客户消费行为和诚信记录作出尽可能全面的综合分析,开展基于互联网大数据的第三方征信服务,这在传统金融机构中算得上是第一家。
那么,除了畅想在未来的某一天,企业可以结合第三方数据、互联网大数据做更多征信业务之外,积累了千万级用户数十亿条消费信息数据的传统银行,该如何利用自己原有的业务数据积累做到实际上的线下营销落地?毕竟,线下的消费数据沉淀时间更久,关联着的信用卡账户甚至还包括许多个人资产证明、工资证明等材料,跟互联网企业相比,省去了线下征信调查的步骤。
浦发信用卡中心的首次尝试的切入点在信用卡,并选择了天玑科技的大数据团队作为解决方案提供商,而在天玑科技背后,更有智树科技等科技创新公司提供大数据技术分析的支撑。除了上述线下数据沉淀的优势之外,选择此次合作,是因为信用卡中心利用大数据做业务落地能挖掘用户的增量消费需求吗?
对于这个提问,天玑科技的大数据团队负责人梁晟认为,信用卡的透支功能、用户消费特征都需要大数据做把控,并做实时营销方案,“信用卡中心是最关注用户行为、消费习惯,希望用户多刷卡消费,获得更多的流量。主要的目的:第一,获客,拿下增量的客户群体;第二,争取让已有的客户增加消费。浦发银行信用卡的客户群主要是华东区的白领,都是收入相对比较高的人群”,这其中的数据含金量很高。
梁晟毕业于复旦大学计算机系,硕士学位,多年来从事金融、运营商的应用架构和咨询,对大数据的实践落地有着许多独到见解,并同时带领团队选择了银行业这个数据价值密度较高的行业,以信用卡业务作为切入点,在促进信用卡业务获客、营收甚至风控等方面,迈出了实践的一大步。在他看来,信用卡的三大痛点及背后根由,主要分为实时营销、数据关联、银行缺乏落地实践等,归纳总结如下:
第一,信用卡交易的数据量特别大,用户量千万级,用户历史信息和记录数十亿,年交易量超越了十亿级。而与之对应的,核心系统还是基于原有的成熟架构的系统,主要针对 OLTP 的在线事务处理。原有的核心系统运行稳定,但不适合做在线数据分析的处理。
通常用户刷完卡之后,核心系统需要对用户进行复杂的状态计算,才能作出这笔交易成功、或者不成功的判断,这个过程在系统中必须确保整个事务的完整性。整个计算过程数据处理量是多少?速度怎样?梁晟回答,“大数据服务平台现在做到以单节点数万笔 / 秒规则匹配。分布式架构是计算集群,原则上可以线性扩展,以时间衡量的话,处理速度为微秒级”。
在判定这笔交易成功后,系统先进行虚拟账的记录,可能到当日统一清算时,再记录会计账。整个事务处理的复杂性的要求导致核心系统腾不出时间做实时营销,并且使用的还是传统的技术架构以及数据处理方法。一旦在任何环节,会计账或者虚拟账出现偏差,其错误原因的排查往往要耗费大量精力。为了保证数据的一致性,银行信用卡业务往往相对弱化性能,更难以进行更多的实时营销支持。
第二,随着日积月累的数据沉淀,核心系统和各类业务应用系统的数据也越来越杂乱,“噪音” 越来越多。数据处理系统多,可能每个系统都有分析、数据挖掘的功能,但是数据必须形成关联圈。需要有一个大数据的平台独立在信用卡核心系统之外,把数据进行清洗,更关注用户、做用户画像,更主动甚至自动进行实时性的营销和推广,且保证逐步增长的精准性。
第三,不能做到对用户的实时营销。原本的核心系统在包括长事务的多个环节,需要对许多信息进行判定、核实(比如额度是否透支、上期还款是否已到位)才能确保交易成功,没法同时完成实时营销。如果在核心系统之外另外开发一套数据系统,导入新流入的用户交易大数据,那么就可以在核心系统之外做到数据的实时更新,既不影响核心系统的事务处理,又可以据实时更新的数据,并以这些数据做在线实时分析,触发事件式精准营销。