第四,数据质量,站在中国移动的角度,在过去15年建立整个数据的过程中,当年说数据质量问题占60%的工作量,真的十几年现在工作量60%是数据质量问题,我了解的业界互联网刚刚开始暴露这些问题,而且运营商的数据质量的计费这方面是比较准的,你稍微一有偏差,用户肯定不干了这要很准才行,整个数据质量我们磨合了十几年。这个应该怎么做?中国移动2006年开始做原数据模型的建设数据质量的监控,我们做了大量产品化的东西,目前是服务内部客户为主,让内部客户参与到运营过程中。
这是中国移动做的大量的工作,这是列到2009年的规范,150册一千多万次,每年在坚持投入做这个系统,这个过程包括模型接口每年都在做新增的标准化,这些工作量应该是能看出做大数据的辛苦。这里有很多血和泪,在做大数据的过程中,可能大家看到的是光鲜的一面,作为技术人员,我们过去有很多血泪史,做了大量的基础性的工作。这是我们做大数据的时候真正进入后期的时候一定要做的工作。
这是本人出的四本书,这是2004年2005年刚开始建数据仓库的时候,写了两本书,一个是《数据仓库在电信领域的应用》,这是翻译的《数据仓库的基础》,当时主要是统计数据仓库能干什么,2001年做数据仓库的时候国内专家不超过20个人说的清楚。去年写了两本书,《大数据和大分析》,这是第一次提出大分析概念,业界更多强调数据的整理会聚和平台的建设,最关键的是分析,我们干了15年,分析的内容很多,这本书里有很多案例。第二本是《大数据的互联网思维》,这是我个人的一些反思,数据仓库还有一个教授提他的框架,但是大数据到现在为止没有一个框架,是纯实践的东西,我个人借鉴了互联网思维,包括大数据产品长什么样,大数据使用者是什么样,他怎么提高客户感知,让客户说你好等等这方面的经验包括中国移动做的探索,这是整个探索对大数据理论发展和体系发展的探索,大家也可以感受一下。
中国移动是大数据的承载者和倡导者,2000年开始做大数据,也是最早的,中国移动也是一个建设者,中国移动在大数据领域,把能涉及的技术都做了探索,最后中国移动也是大数据的运营者,在大数据对外工作方面做了大量的基础性的工作,包括对外的服务和变现。在整个过程中,过去的15年间,整个团队包括各级领导,当年能够有这个见识这样建数据仓库确实是有远见和卓识,中国移动2001年开始做这个系统,在做的过程中包括省级的各个同事奋斗15年,包括我们的合作伙伴,我们合作伙伴在大数据领域的技术水平在业界是数一数二的,因为我们都干了15年了,特别感谢大家。在整个大数据建设的过程中,我个人觉得可能会给电信运营商一些新的战略转型的机遇,在这个方面的利润有可能有一些新的增长点和新的发展趋势出现,在此,我们在做15年的过程中有一些经验愿意和大家分享,大家有问题再跟我们联系。