中国IDC圈4月28日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。28日上午大数据推动金融创新分论坛中国信息通信研究院技术标准研究所移动与大数据部副主任魏凯做了主题演讲。
中国信息通信研究院技术标准研究所移动与大数据部副主任魏凯
以下是魏凯演讲实录:
魏凯:非常感谢李司的介绍和各位嘉宾,在众多金融IT领导和专家面前讲金融大数据,我觉得我胆子够大的。我介绍一下我们数据中心联盟做的事情,和大家交流一下,不管多么粗浅请大家批评,我们认真学习和改进。
我是中国信息通信研究院的魏凯,同时也是数据中心联盟大数据作组的组长,我们一直在做跨界对接的事情,数据中心联盟是拥有170多家会员的行业组织,会员是由IT公司组成,我们成立了金融委员会,我们希望把两个行业通过这个平台对接起来,我们一直在做这样的努力和尝试。但是因为隔行如隔山,我们学习的时间很短,所以了解不是很深入。
我的题目是我们在金融大数据平台测试方面的认识和工作及下一步的计划,首先讲一下大背景。刚才几位银行老总和化老师、李总都讲过了,大数据的发展非常迅猛,大家期望值很高。实际上拐点还没有来到,现在还处于转换的过程中,大家的期望非常高。我们看到国际上也是这样的情况,Wikibon公司,去年发布了对于全球很多地方很多机构的用户大数据发展过程中的情况调查,他的文章标题是实际上大数据分析是非常难的,这是他最根本的观点。有几个分析我觉得很有意思,调研几百家机构,这些公司都认为未来两到三年、三到五年的时间周期内,大数据投资上每花1美元能挣3.5美元,这是未来的预期。同时他们得到了2014年做调查时候的数据,在大数据上花1块钱能挣5毛5,理想很丰满,现实非常骨感,这是真实的情况。
现在的情况是目前还是改善型,把原来的工作交给了大数据平台,业务类型平移的事情比较多,影像存储、报表升级等改善性的需求居多。创新性的由业务人员驱动的时代还没到来,这个时代到来就是拐点出现的时候,金融机构愿意砸钱的时候,厂商躺着数钱的时候就到了。现在的情况是还处于改善型居多的应用场景中。我们去年对国内很多客户做了一个调查,61%的人认为提升效率降低成本是现在大数据最明显的应用,不是去拓展新的业务领域和创新性的业务模式,这是现在的情况。
金融行业做大数据有个演进的路线,有两个维度,一个维度是我们需要更多的数据,把内部数据做整合,把原来的数据烟筒打通,把不同的数据汇聚起来把内部数据用好,内部会汇聚内部数据和内部数据,做多源数据的分析才能产生更深的化学反应,产生新的业务,这是数据这个维度的趋势和路线。工具层面,我们要有更低成本更高效率的技术平台、技术工具,要有更好的分析技术,这是大家公认的几层,要呈现报表、统计分析、查询,这都是呈现的能力,是最基本的能力,知道现在发生了什么,最高的是决策预测未来发生什么,目前未来发生什么我们还不能很好地决策,两个维度去演进,会有很多中间的形态去发展,这是大概的路径。
现在平移居多,大家用技术手段来改善原来的信息系统的能力,降低成本。正在发生的事情就是大数据平台正在为数据仓库减压,这是很明显的,有调研数据,也是Wikibon的调研。他问了一个问题,你们公司有多少负载正在从传统数仓往大数据平台上迁移,61%的人都说确实是这样,刚才建行工行的老总都印证了这个观点,传统数仓的减压的工作正在发生,这是一个非常明显的变化。但是减压减到什么上面,是开源平台。开源平台的问题是很多兼容性、稳定性、安全性能不能满足金融行业的需求,这是一个非常大的问题,开源很多设计不是面向这样的需求,包括灾备等问题在开源社区没有想到这些问题。从开源到商用产品到能够支撑生产系统运营的软件还有很大的距离,我们联盟要架起一个桥梁让供给侧和需求侧对接起来,我们一直在做这个工作,我们想各种办法来促进这个事情的发生。供给侧,我们跟联盟的很多成员核心的企业,一起来制定标准和指标,跟需求侧对接,跟银行电信金融工业交通这些行业对接,输出一些技术白皮书和规范,希望能够把这两个需求弥合起来。