中国IDC圈4月27日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。
其中,在4月27日下午“大数据与城市交通”分论坛上,中国联通智慧足迹数据科技有限公司总经理李振军发表了精彩演讲。
中国联通智慧足迹数据科技有限公司总经理 李振军
以下是李振军演讲实录:
李振军:尊敬的各位嘉宾各位嘉宾大家下午好,我在这里跟大家分享一下国内运营商中国联通在大数据领域的一些实践和探索。我来自中国联通的智慧足迹公司,应该说中国联通为了做大数据业务,专门成立一个专业的大数据公司,叫智慧足迹,这个公司有几个特点:
一是我们拥有中国联通所有的数据,打电话数据,发短信数据,还有上网数据,以及终端数据等等,。在位置这块因为跟交通有关系,位置这块整个交通数据特点一个是时间的连续性,因为GPS数据包括互联网公司不一定是连续采集。另外还有一个是空间性的完整性数据。中国联通数据还有一个特点,就是全国集中。2012年中国联通就开始把全国大数据集聚,这是一个非常大的好处。当然我们中国联通数据不是只站在自己的角度看,中国联通、中国移动、中国电信三大运营商是从用户群这块看大数据特点,所以在数据层面我们希望进行合作。
二是我们的专业性,我们有专业产品,专业团队、专业应用。这个产品是什么,欧洲一个非常知名的Smart Steps的技术产品,国外用了五年左右。接下来我给大家对这个产品做简单分享。国内大数据来看,大数据基本上是从字面上的东西转化成可视化的东西。但是智慧足迹产品往往是新的项目归集数据,建模,看数据跑的内容。还有就是这个数据是否还原了原貌,所以我们就用了这个Smart Steps足迹这个产品。
我们可以看到每条线每个人的驻留和出行数据跑下来,QI以及他的传输路线做分析。基于刚刚我提到的中国联通2.8亿的数据,国内所有基于位置的写洞察分析无外乎是人口分析、POI点分析,还有出行路线和出行方式识别分析,大家基本上都是这几个场景。在这个场景里面我们主要做了哪些场景工作?给大家报告一下,我们定了一个点我们来数人数,这个情景看起来很简单,大家知道我们定位是基于小区的定位,这个是圆形或者是扇形,就会带来一定的噪音,比如说广告大屏这面是有效的客户,背面就是无效客户,对于他来说就是无效的噪音。传统方法这个是不可信的,而我们Location加权质心算法来保证数据的准确性。
第二个场景就是位置信息大家所用到的POI点,包括他的工作点,以及常去的商圈和活动地点,传统的运营商做法是基于快照式的,这个时间这个点切入多少作为一个驻留点,而我们是20分钟和30分钟以及常月进行动态分析POI.
第三个点是出行路线选择,我知道他去哪里,但是对于运营商不知道他到底走哪条路,挑战很大,我们一个是基于用户真实经过点采集,另外根据数据匹配得出最大方位的路线。
第四块是智慧足迹分析方式。另外比如我们这次开大会,这次大会的人从哪里来,从哪个市哪个县来,都可以做外推。
最后一块是基于运营商策略做小节,我们用了Location逻辑,第二点多基站加权运算,第三点自动降噪较准定位,我们一个广东省数据一天100亿条,我把这个数据转化成高价值数据,我把数据就保留出来,我就可以评估五年前和两年前的数据,这是非常宝贵的财产。接下来我们还有车效率久,我们可以为用户保留75%以上的成本。
第四块我们做城市高速路况监测,高速怎么监测了路况?现阶段高速公路监测成本更高,实时成本,还有线路传输成本,另外还有维护成本特别大。我们中国联通运营商把传统的手段降到1/50,这个我们一周之内就可以把整个效果做出来。这是我们整个算法结构,从数据沿途路线数据采集,到算法模型沿着高速两端做基站,选完基站测算速度,来可以算出拥堵情况。我们会根据ETS运营商数据可以把现在交通部门监测的手段串起来,从而提供更好的为老百姓出行服务。