杨明川:运营商大数据,困难中前行

中国IDC圈1月7日报道,1月5-7日,第十届中国IDC产业年度大典(IDCC2015)在北京国家会议中心隆重召开。本次大会由中国信息通信研究院、云计算发展与政策论坛、数据中心联盟指导,中国IDC产业年度大典组委会主办,中国IDC圈承办,并受到诸多媒体的大力支持。

中国IDC产业年度大典作为国内云计算和数据中心领域规模最大、最具影响力的标志性盛会,之前已成功举办过九届,在本届大会无论是规格还是规模都"更上一层楼",引来现场人员爆满,影响力全面覆盖数据中心、互联网、云计算、大数据等多个领域。

中国电信北京研究院杨明川博士出席IDCC2015大会并在大数据应用与安全技术论坛发表主题为《运营商大数据,困难中前行》的精彩演讲。

杨明川

中国电信北京研究院杨明川博士

以下为杨明川演讲实录:

大家好,我是中国电信北京研究院云计算大数据产品线负责人,今天给大家分享从运营商这个角度来看怎么在大数据产业中进行创新。首先回顾一下大数据产业的发展。具体的细节我不说了,里面有几个判断,第一个判断,大数据从开始爆发到现在,特别是去年下半年到现在过了发展的炒作期,整个产业大数据的价值并没有以前想象的来的那么直接、那么快,整个产业还是处在从高峰回落的阶段,但是整体来讲大数据产业很快会迎来复苏。第二个判断,大数据产业复苏有几个驱动力,第一是政府大力的支持大数据产业的发展,政府出台了很多相关的大数据措施,政府也在建国家级的大数据开放平台。第二,一个新的机遇是互联网+,现在大家觉得比较有意思的比较成功的案例来自于互联网领域,大数据未来的空间可能在互联网+,后续的发展怎么围绕互联网+是我们下一步考虑的重点。

云和大数据之间是密不可分的,站在互联网+的角度来讲,云和大数据是打造整个互联网+的基础设施,互联网+有几个大特征,它的移动化、低成本、大规模协同、扁平化、信息透明、按需定制等等,在驱动互联网+往前发展的时候,云计算解决的是信息基础设施的问题,通过统一的云计算平台,使互联网+能够朝线下系统朝线上系统迁移,实现平台化,实现扁平化,实现低成本。大数据扮演什么角色?大数据在互联网+里打破了信息壁垒,信息壁垒来自于我们的服务提供商和客户之间,我们的产品和用户之间,我们的产业链上游和下游之间,大数据通过打破信息壁垒的方式构建更加高效、更加有效的平台,大数据使得我们更透明、更有效、更可信。云计算和大数据未来真正的空间是构建互联网+的浪潮中。

从我们研究的实践来看,数据和技术双驱动,数据这条线是大家比较关注的,我们需要有持续的、庞大的数据源,这个数据源来自于运营商,来自于政府,来自于企业,来自于未来可能有物联网,这个庞大的数据源是所有做大数据的基础,但是光有这个数据源不行,还要接下来从数据层面上把数据打通,刚才魏凯讲了,国内现在在大面积地做数据交易平台,包括政府、企业,就是要把数据打通,在这基础上我们要实现数据的价值。但另外做所有这些事情都离不开技术,基础设施方面,Hadoop也好,NoSQL也好,是基础设施层面的大数据技术。接下来进行大数据的算法分析,包括机器学习,各种各样的大数据的分析手段,应用层的数据可视化,这两个明显的线条是驱动大数据发展的产业结构。从运营商的角度来讲,我们目前还在左边,我们在基础设施层面、创新层面,未来这两条线是我们关注的重点。

从运营商做大数据来看,我们做的几年中,这里面遇到了很多困难和困惑,这个困惑有整个产业的困惑,也有我们来自运营商角度的困惑。数据壁垒,所谓的数据壁垒包括企业内部的数据壁垒,整个产业有数据壁垒,大家都知道大数据是核心资产,是金矿,既然是金矿大家都不愿意拿出来,产业中各个公司之间的数据很难流通,甚至很难去交易,大企业内部不同部门之间、不同系统之间的数据仍然因为技术的问题,因为机制的问题,也存在着一些壁垒。数据的完整性,大家都知道大数据和小数据、结构化数据很大的差别是它很庞大,很庞大的同时带来一个问题,数据的完整性远远不如之前做BI、做统计分析,大数据的数据壁垒,还有数据关联性、数据的实时性、数据的污染。做的过程中由于数据采集方式的问题,也有恶意的问题,会不可避免地导入一些失效的数据或者错误的数据,怎么有效地识别和处理污染也是一个大问题。