刘贤荣:建行数据资产管理的现状、实践和期待

2014中关村大数据日于2014年12月11日在中关村举办,大会以大会以“聚合数据资产,推动产业创新”为主题,探讨数据资产管理和变现、大数据深度技术以及行业大数据应用创新和生态系统建设等等关键问题。大会还承载从政亚信府主管部门到各行各业的需求和实践中的疑问,探讨包括政府、金融、运营商等部门是如何通过数据资产管理和运营,实现转型发展和产业创新的路径。

在下午的金融@Big Data论坛中,中国建设银行总行CIO刘贤荣带来《建行数据资产管理的现状、实践和期待》主题演讲。其内容有三个部分,第一个是作为银行里玩数据的人怎么看待大数据这个事情。第二个现在说银行是战略资产,数据资产建行在管理方面做了什么工作。第三个建行对大数据有什么期望。

以下是他演讲全文:

刘贤荣:今天给大家介绍一下,我其实应该是数据管理的实践者,因为很多情况下,王主任也提到,大家对银行数据感觉到银行本身是保守的行业,银行数据说按照隐秘状态的话,银行数据绝对是最隐秘的范围之内的。业界很多玩数据的人可能觉得银行的数据里面可能有很多价值密度很高的数据,能不能共享。我想用下午的一点时间跟大家分享我们的做法和思考和我们的期望。

银行最近这三年,其实在数据应用方面应该说有一个非常大的思想上或者认识上的看法。下午交流的内容有三个部分,第一个是我们作为银行里玩数据的人怎么看待大数据这个事情。第二个给大家简单看看,现在说银行是战略资产,数据资产我们在管理方面做了什么工作。第三个我们可以看一下后续我们对大数据有什么期望,这也是我们以后要努力的方向。

事实上建设银行我们希望利用几年的时间有一个大数据的目标,这个目标是我自己主动提出来的背景,很多方面这也是我们应对挑战做的反映。这两年互联网金融在体量上跟银行不可比,但是很多方面对银行的穿透业务造成了冲击。我经常说一个例子,说很像大革命时代。大革命时代,现在很多的互联网公司用先进的手段,我们就是拿着大刀,叫土鳖也好什么也好,那我们怎么主动应对挑战。

可以看到我们认可的传统意义上的我们认为自己是一个报表性的机构,这是银行数据,很多年前,那时候我到建行我们叫统计部门,统计部门干的报表。现在处于什么阶段?现在处于分析型的阶段,事实上我们在很多领域,大家日常有很多银行的业务,在后端有很多分析模型支持。比如像你的信用评级,你的很多产品。以后我们可能是走向信息导向型的机构,就是数据驱动,这是我们的目标,目标型的一个方向。我们对数据资产的认知,我们怎么看待数据这个问题。大家看到作为银行的数据资产的中间,我们是中间的一个部分,全景的数据示图,或者叫数据断识。把客户数据、产品数据、交易数据、员工、机构和渠道数据,把他们完美的融合到一起,形成一个统一的客户,或者说一个数据示图。我们目标有三个方向的价值,第一是决策力,第二是洞察力,第三是供货能力。实际上如果再深入归类,我们的大数据产略目标是第一我们希望更深的和客户联系在一起,我们要和客户贴在一起。第二我们真正把数据作为工具和手段,甚至作为技术用于帮助我们和客户来结合在一起,这是我们对数据的认知。左边可以看到,实际这就是我们现在讲的大数据的一些概念,银行数据量是比较大的,原来我们是报表级的,现在我们是准、时、实,后面是数据的多样,这个很好理解。

未来的挑战,大家看到这个图,左下角是我们银行目前的能力集中的部分,结构化的静态的海量的数据。但是我们的挑战渐渐来自于右边,就是动态的海量数据,这是很多互联网金融公司他们用动态数据进行攻击。我们很多的数据,我们打电话到银行,电话银行的数据,通过手机和网络银行的行为数据,甚至更多的视频数据,都会渐渐纳入银行的数据管理的视角。我们经常讲大数据的应用场景,我们现在讲的对数据资产的认知是希望它作为一个工具和手段帮助我们更好了解客户,最本质是帮助我们为客户提供服务。可以看到事实上有几个挑战的。

第一个客户的身份认知数据,怎么知道你的客户是我的客户,什么时候可以提供服务。第二你在什么位置,其实王主任也讲了,这个数据是很敏感的,很多情况是需要客户的知情权甚至是客户的允许权,大数据时代我们最强调的数据的所有权归谁。第三是洞察,所谓洞察就是我们要实时的知道客户需要什么服务。比如说一个客户在网上银行最近经常浏览我们的理财产品,过了一天之后这个客户到柜台上去,我们怎么知道这个客户到柜台是买理财的?把客户的本身的内部传统的数据把它融合到一起,才知道客户打电话的时候,到网上银行的时候,到网点的时候到底想要干什么,然后可以事先的做产品和服务的准备。最后一个就是第一时间,就是现在互联网时代,甚至移动互联网时代最为关心的事情,就是怎么样第一时间相应客户的需求,甚至在客户需求他发现之前我们找到他的需要。

这是我们对大数据的认知。第二部分大家可以看看,既然说现在搞数据管理,搞大数据,银行在数据管理领域我们做了哪些事情?简单跟大家过一遍,第一是数据的能力体系,所谓数据能力体系就是银行到底建立什么数据管理能力,才可以适应大数据时代要求,达到大数据行业的目标。其实是三个纬度的工作,这三个工作我们玩数据都知道,每个工作都不是好干的,都不是想象中的拿着数据就可以去打仗的。真正的工作是在后端,怎么把大量的数据整合到一起,首先是最细的,就是大数据时代的自采集,这是跟传统意义上数据的很大的差别。传统上我们有一个最简原则,原来是非自动化流程,这个时候为了保证流程体验最佳,我们的要采集的信息和录入内容越少越好,保证体验最优。但是现在随着自动化的产品的渠道,包括新的一些设施之类的,我们发现很多数据我们需要在力度做大量的工作。第二层面是数据管理,我们在座真正搞数据的大家知道,这个是最痛苦的阶段。就是怎么把各个路径,各个方式,甚至是不同的渠道采集的数据,我们把它整合到一起,所谓整合到一起就是生成一个统一的示图,如果搞大数据洞察这是必不可少的,大量工作是做数据整合的工作。右边是体现我们的价值的,我会有大数据的模型,通过大数据有洞察,这样产生价值,所以最后是数据的应用模式,有传统意义的,现在包括很多新的手段。这三个结合到一起是我们说的,我们在数据里面我们的真正的能力体系。

这里有很多工作大家看一下,这个张有点复杂,就是管控、采集、整合和运用。我们要完整的把它们融合在一起,整合好的数据在不同的银行领域里有什么应用?这是我们做数据管理的人和做业务的人交流的时候的鸿沟,这个鸿沟是什么?比如开会的时候大家会讲你做数据管理,你告诉我数据管理可以帮我什么?在之前我们做数据管理我的第一反映是什么?我的第一反映是我有很多数据,你告诉我你要干什么,我通过数据解决你的问题,这是玩数据的传统的概念。但是现在的情况下我们讲大数据,或者数据资产的领域里我们通常会建立一些业务框架模型,这个业务框架模型会把银行很多业务领域,比如客户洞察需要干什么,风险洞察干什么,渠道洞察干什么,在这里面不停的细分,就会形成一个非常广阔,或者非常庞杂的业务模型。这个模型里数据干什么?这是做数据银行,数据管理,数据运用真正要思考的。以往是给大家提供主持和决策服务,我们的数据真正要干的事情是帮助业务部门去真正优化他的流程,真正找到他的客户,真正帮助他怎么样为客户提供更好的服务,这点称之为运营数据,这是数据资产管理的下一个目标。

数据资产的应用体系大家看到,实际上它需要一个系列的环境,尤其对大型银行而言,这个不是游击队,游击队经常是拿到什么数据就用了。但是作为系统性的来讲从软硬环境,从交付评价、需求和管理等等,我们要建立一套成体系的结构出来。

后面我们会发现为了达到这个目标我们有很多能力,首先是数据管理能力,以往银行也很痛苦,很多年之前的时候,银监会的数据也好,人民银行的数据也好,包括我们内部的管理层数据也好,我们就是疲于应付。这就是以往我们经常面对的场景,什么场景?你提供一个数据用户不相信,监管挑战你,你的管理层也来挑战你,你的数据为什么这样?开始总是找不到数据,就是找到一个场景根本不知道数据在什么地方,然后到处去找,有些是手工的,有些是做测验出来的,或者模拟出来的,经常不一致。那么数据管理的真正目标就是数据的良态的生态系统,这个生态系统对单位内部是这样,对整个一个国家也应该是这样的。上午交流的时候为什么强调数据生态环境,在这个环境里每个人都必须是一个贡献者,每个人都是一个应用者。这个环境里发现对每个企业而言,对整个国家而言我们会形成一个比较良好的生态环境。这个可以跟大家分享一下,在数据管理里其实有很多机构他们建立了比较良好的框架模型,这个框架模型就是没有好坏之分,只有是否应用。所以在企业里可以找一个,这是我们定义出来的分析模型,我们定义的数据资产管理体系。这个体系对大银行或者小银行,对不同的数据文化可能都是不太一样的。后面就是数据挖掘能力,有了数据,有了数据整合,真正产生价值和作用的。我们希望从海量数据里找到我们的真正的规律出来,原来叫数据挖掘,或者大数据应用,很多公司也是在干这样的事情。

我举了几个例子,比如说盈利性的分析。整个数据挖掘的视角其实很多地方不太一样,我们内部也做了很多工作。如果说是总结一下想法是这样的,不要期望数据挖掘一开始做到一个非常大的体系,数据挖掘起作用的是具体的场景,首先找到非常具体的小的应用。比如说大家知道如果说大数据在银行应用,大家可以想出一个庞大的体系里来,最早跟美国银行交流他们讲了一个例子,美国银行的数据应用最早让大家起作用,或者让大家一下知道数据有用的,大家知道是什么案例吗?非常简单的案例,运钞,通过观察美国的很多的ATM机,每天的加钞量,运钞的量设计出来,比如在纽约每天的加钞机应该是什么路径,甚至细到加钞机只能右转,在碰到红绿灯这个车必须右转,最后通过数据发现这样是最佳路径,发现很多数据挖掘的时候是这样,这是我们设计的框架,这个框架是一个(英文)的框架,真正做的时候是找细节,找真正环境的。

最后一点,我们说数据要真正发挥价值,其实我们做数据的人喜欢我自己认为我是一个技术体系,自己做数据采集和整合、挖掘,但是大家要记住一点,数据真正起作用是要用,我们必须把数据,基础数据也好,数据挖掘模型也好,要嵌入到一起才有作用。比如我可以有一个流程,可以帮助找到用户,最关键怎么把数据嵌入到流程里面去,数据应用能力对银行而言是事关数据价值的最核心的部分。数据产品、基础数据可以少一点,但是如果要建一个体系,首先要把数据跟业务真正的融合到一起。包括怎么样做数据整合之类的,大家看到实际真正做数据管理我们首先讲大数据有很多非常完美的情景,但是从整个数据资产的管理,数据资产实践来看,大部分工作都是在两个方面。第一方面是基础数据管理,第二是怎么把基础数据应用到流程里去,就两个事情。每家银行和企业的做法都不太一样。

第三个是展望一下未来,我们提出一个目标叫建立大数据行,那大数据行干什么事情?因为我们有很多内外部的挑战,更多是我们有很多的机会。因为我们突然发现我们面临的外部的环境变了,内部的管理水平也变了。首先我们定位了一个大数据的应用方向,我们内部定义我们讲未来银行是什么?我们希望是一个智能银行,在不同的领域都有自己的不同的智能水平,比如欧客户智能、风险、运营智能,每个领域都有不同的认知。比如在客户智能我们希望达到客户的精准营销,什么意思?以前买书的时候到书店里面去,这是十几年之前的事情,为了找到一本书,可能从一层到四层,新书出现可能根本看不着,但是大家现在亚马逊、当当等等,我最近买书就很简单,我连续几年买书之后,我想要的书他们都能相对准确的提供给我。过几天我一看基本就把这个领域的新书差不多了,银行也是一样。还有交叉营销、客户体验、客户服务等等。大家知道最近很火的一个体验叫做智慧银行,很多银行在干这个事情,我们建行在深圳也搞了一个智慧银行,感兴趣的可以有时间到深圳去体验一下。

这是大数据的价值和应用的概览,这个大家可以简单看一下,这是我们整个大数据的方向性的东西。比如怎么定义数据策略,其实大家会发现很重要的几点。数据分类,这个是很核心的。数据收集原则,数据安全和质量管理等等。对数据的话两个最重要的特点,第一是数据质量,第二是数据活性,这是跟数据采集有关系的。大数据的方法,还有应用架构,包括不同的能力体系,大数据的管理,分析对象,包括大数据的技术和一些分析挖掘的模型等等。总之是根据不同用户的需求我们提供不同的数据应用和服务能力,大数据真正想看到的情况有几个,客户的示图,实时的客户交付平台,银行的生态环境。银行最希望干的是什么?最近这几年我们总结我们银行的数据,发现银行的数据大家说其实我们的价值率都很高,这个是站在传统的视角来看,但是现在我们发现我们了解客户,银行的数据有一个缺陷,往往到一个环节就被阶截断了,客户到底买了什么我们不知道。再比如说数据到了支付宝,支持到客户把钱转到支付宝,客户到支付宝到底干了什么我们也不知道,大家发现这是银行数据的一个天然的缺陷。未来希望通过跟业界建立一个比较良好的生态环境,首先保证数据的安全,第二保证数据的隐私,这两个前提下,银行数据永远都不会突破这两点,这是现在搞大数据的时候的两个底线,这两个底线无论业界有多少好的数据采集原则,多少好的数据采集方向,但是数据隐私安全要保证。这个基础上可能建立一个比较好的数据的生态环境体系,通过这个太环境把银行和客户串在一起,这个工具就是数据。

其实有几个比较重要的理念,以往讲数据业务,现在怎么利用数据更好的做业务。比如说怎么样通过数据技术,也就是类似于技术一样,我们通过数据要知道哪些流程可以优化,传统的银行流程比较复杂,数据丰富到一定程度,对数据应用到一定高度,有些流程是可以优化的。比如大数据真正要作用的话,其实银行而言三统一是必然的,统一数据、平台和服务,必须把银行的内外部的数据打到一个环境里去,在这个环境里进行整合,只有整合在一起我们才能达到我们提出来的智能的目标,这是我跟大家分享的。希望有机会我们在不同的领域或者不同的环境可以探讨,怎么样让银行更好,或者帮助我们达到我们的战略目标,为客户创造更多的价值,这是我们玩大数据的一切目标,谢谢大家。