中国IDC圈4月28日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。28日上午大数据推动金融创新分论坛中国银行总行软件中心上海分中心副总经理牛晓峰做了主题演讲。
中国银行总行软件中心上海分中心副总经理牛晓峰
以下是牛晓峰演讲实录:
牛晓峰:非常感谢李司,刚才听了前面六位专家的介绍,确实觉得受益匪浅,在实际工作当中遇到的很多问题,通过今天的聆听和学习,感到有了一些新的思路和新的想法,非常感谢主办方能够举办这样一个活动,让我们有机会学习到更多的新思维、新观念,以后有这种活动的时候请主办方一定记得通知我。跟大家汇报中国银行大数据方面的思考。
大数据的发展背景,我不再多说了,目前随着互联网的发展,互联网金融下的大数据发展得非常迅速。我选的这张图是4V,我还见过5V、7V说大数据主要的特征,增长快、变化多、类型多,最关键的还是它的价值。这张图是2013年史文博格(音)在大数据时代里陈述的比较主要的关于大数据的观念,大数据时代给人类的思维带来新的变革,2013年到现在不到三年的时间里,这本书里的很多观念已经有了很多的变化和发展。他在互联网大数据的思维里提到的量化意识、全量数据的观念,现在已经有人把它做了发展和完善。比如全量数据,在银行里我们都知道银行因为自身经营业务,中国银行有上百年的历史,我们积累了大量的数据,是不是说这个数据的量越大就越符合大数据的要求,就越能够挖掘出数据中的价值呢?其实不一定。我们都知道美国现在正在进行下一届的总统选举,特朗普最近的风头很大,美国有一个习惯,每次在总统选举之前都会有一些民调机构预测这次哪个候选人会获胜,其中比较著名的就是盖洛普,盖洛普是怎么成名的呢?
之前美国有一个杂志叫做《文学文摘》,他成功预测了1924、1928、1930年总统的选举结果,到了1936年又是这家杂志预测当时的候选人叫兰登会获胜,《文学文摘》的结论源自于对240万人做的调查,那时候盖勒普只调查了5000人说罗斯福会获胜,事实是罗斯福以很大的优势击败了兰登获任美国总统。为什么对5000人的调查会超过对240万人的调查,是不是数据量越大就一定表示调查的结果越准确,事实证明不是这样。盖洛普选择的人,在人的分布上做了精心的分化,这5000人分别代表了不同地域、不同种族、不同年龄、不同教育背景、不同工作、不同党派,尤其是中间派的人物,他做了这样的选择。对数据的选择的覆盖程度高决定了他最终预测的结果更准确。在大数据领域,虽然只有短短的几年时间,很多的思维已经有了改进和提高。
看看中国银行有关大数据的战略规划和我们实施方面的一些想法。这是我们的主管行长之前就大数据如何进行建设的时候提出的以平台为支撑构建大数据的技术体系,以数据为基础充分整合数据资源,以应用为驱动深入挖掘数据价值,以人才为核心提升数据分析能力。短短的四句话非常具有战略指导意义。2014年美国的Ganner对一千多家企业和政府机构做了调查,当时的调查有65%的企业和机构表示他们正在进行或者在不远的将来会进行大数据方面的项目的上马。在这65%的企业里有30%在当时已经开始了,另外有19%是准备在2015年之前半年之内开始他们的大数据项目,另外有16%准备在2016年才开始自己大数据的项目。
实际结果到了2015年下半年将近年底,Ganner对这1000多家企业和机构做了另外一次调查,大数据项目成功上马的不到9%,为什么?Ganner对他们没有成功做了原因的分析,其中比较重要的几条是这样的。排在第一位的是无法挖掘出数据的价值是什么,第二位是企业或机构没有明确的大数据的战略目标和战略规划,第三是缺乏核心技术,第四是无法有效的整合数据资源,第五是企业的内部无法对大数据的实施和规划达成共识。总结了这样一些不太顺利的原因之后,我觉得有一个清晰的完整的系统性的战略规划,对中国银行以后大数据的建设的作用是非常巨大的。