互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。
其中,在4月27日下午“大数据与城市交通”分论坛上,城市交通节能减排检测与评估北京市重点实验室主任、北京交通发展研究中心副主任温慧敏发表了精彩演讲。
城市交通节能减排检测与评估北京市重点实验室主任、北京交通发展研究中心副主任温慧敏
以下为温慧敏演讲实录:
温慧敏:下面我跟大家分享一下交通数据在北京的实践与展望。在交通领域所谓的大数据,可能跟我们传统想到的数据有所差别,这个量其实没有那么大,即使是叫大数据,其实也没有那么大。银行、电信系统数据量还没有那么大。但是为什么叫大数据,像刚刚很多同行已经说了,目前移动互联网以及电信数据能够给交通使用的数据,所以我们交通遇到很大的挑战,所以我们传统交通数据通过数据积累,我管它叫长数据,我们积累了十年和二十年的数据,这种情况下我们也可以叫做大数据,尽管它十分钟、五分钟或者十五分钟的时间量不是很大,但是积累了长时间的数据量之后数据也是非常可观的,所以我们主题叫做交通大数据在北京的实践与展望。我想介绍一下北京交通在大数据应用的情况,另外想介绍交通数据,特别是大数据领域应用的一些想法和一些展望。
我想交通的同行可能都比较熟悉我们交通的数据包含几类:
第一个是交通基础设施数据,包括道路网,车辆数据库,以及驾驶员的数据库,这是我们比较基础的;
另一个是交通和城市活动紧密相关,城市活动的数据,包括人口,土地利用以及社会经济发展都是我们交通研究所必须要的基础数据。同时现在的城市发展,以及交通,已经和环境关系越来越密切,而气象同时也会影响我们交通系统的运行,因此交通作为非常开放和复杂的一个系统,它涉及的社会活动,包括社会经济、环境等等方面的数据。对于交通数据本身有大量的运行数据,这些运行数据是每时每刻都在产生的,而这些产生的数据我们能够实时捕捉到,但是有些还没有办法能够捕捉到。但是目前现在技术的发展已经使得我们能够更多的捕捉到这些实时运行的数据;
还有一个我们交通的领域,甚至传统的社会经济发展领域都很常用的一种方法就是调查,这种调查是来源于传统统计学的理论,我们利用一定的抽样率,利用随机的抽样理论,来使得我们以小的样本来构造我们交通方面的模型。所以我们目前面临的我总结出来,主要就是这四大方面数据的类型。
目前北京应该说在全国各个城市应该数据积累做到比较超前的,包括我们流量监测数据,在2008年之前北京市数据起码五环内基本上快速主干道上基本上做了RBMS流量器,另外北京在2008年奥运会之前把所有出租车都安装GPS,这样我们车辆就有了大量车辆定位数据,而且也是持续的数据相对目前我们面临的大数据来说是非常干净规整的这么一个数据源。另外还有北京的电子收费数据,牌照识别数据,事故数据,当然还有移动、联通、电信的这些数据。
另外就是调查数据,我们从北京市1986年进行军民出行调查,详细记录了大概每一户一天完整的出行日志,这样分析整个出行者和城市出行人群的社会属性和相互之间的关系都提供非常好的支撑,当然还有城市背景和其他的数据。
北京市在数据这方面走的比较早,比如第一个例子就是北京市浮动车系统数据,但是现在目前浮动车技术已经相当成熟,包括高德导航、百度等等一系列的这些公司,我相信他最起码是刚实施这个导航服务之初,大部分用的还是浮动车的数据,就是出租车数据。出租车最大的优点在于它很干净,比普通的数据干净的多,我们能够分析他在道路运行的数据。有了浮动车数据,我们累积了很长时间,从2006年到今年的十年的数据,能够每时每刻得到整个道路状况,这样我们把一些发行路段,无论你怎么筛选原则,都可以得到你想要的东西。