温慧敏:交通大数据在北京的实践

同时我们反过来再和城市土地利用、自助,分析整个应用城市功能布局上。当然我们也可以利用这些实时数据捕捉一些特殊场景,比如说莲花桥因为大雨短路之后我们可以得到整个莲花桥交通拥堵蔓延到整个西三环的一个快速路网过程,当然我们也可以计算拥堵消散的时间点,这也是可以为我们做了非常好的数据源。在这个基础之上大家对城市交通指数非常熟悉,最早是数据源交通有这个方法,得到了很多城市的推广。北京的交通指数基本是定性和定量相结合的数值,使得我们用0到10之间的数值反应到整个城市整个道路网的状况,如果6到8就是中度拥堵,如果超过8老百姓感觉非常强烈,因为我们就跨越严重拥堵的层次。这是我们对交通拥堵指数,为什么我用传统的数量来反应全网络的拥堵状况,拥堵里程时间比,最大的就是不敏感,全北京市基本上维持22到25属于之间波动,即使是高峰和平峰之间也不会有很大的变化,这个基本可以理解,里程越长越平均,就看不出来峰谷和尖峰了。所以我们提出交通指数概念,主要原因就是希望它对整个交通指数的变化更改。但凡限行都是交通等级该面,分轻度拥堵和中度拥堵,如果中度拥堵到重度拥堵,这就是全网的数据了。

我一直说我们交通数据某一时刻量不一定很大,但是如果我们积累了每分钟每十五分钟数据,这样的积累十几年,我们数据相当可观,而且可以看到历史规律,这些历史规律对于我们预测未来是可预东西。这是我们统计的以晚高峰作为我们北京市整体运行一年的效果,这个看达标不达标,2010年是有72天不达标,2014年55天数据不达标,每一年都有,这样给我们非常直观的现象。而且从某种程度上来说交通和空气污染有很大的区别,空气污染有很大的不确定性,尽管在宏观上比如说我们北京排暖气的污染PM2.5浓度会比较高,但是有的时候在排暖气的时候风比较大还有其他原因,但是我们交通数据是相当强,但是看到首先是上半年比下半年要堵,这是很直观的。再从月份来看,9月份最堵,7、8月份最好,或者是2月份,2月份因为过年嘛,根据联通数据来看,可能北京直接就少了400万人,或者甚至更多,500万人也有,可能十一的时候至少要有200万人左右,这是比较明显的例子。当然我们对拥堵持续时间没有办法度量和没有这个指标时我们很难客观描绘每年的变化,但是有了这个数据之后,对整个城市交通试点把握还是非常有参考意义,当然有了规律之后我们可以进行一定的预测,尤其是在节假日或者是特殊的高峰拥堵比较突出的日子。我们通过提前预方式,其实某种程度上是使人们主动的减少出行和改变出行方式,我觉得这个说的好点其实就是主动干预的方式,不是说你把车开到路上给你指哪条路堵,到那时候你哪条路都堵,所以这个只能是你削减出行,你换公交和地铁,这是最有效的方式。

当然第三个应用就是IC卡了,IC卡因为在北京实施的比较早,因为我们实施了24则之后,整个IC卡普及率85%以上,100个人85个人都刷卡,一天两千多万个刷卡记录,这对于我们来说是非常宝贵的,而且从2014年底我们北京市整个公交系统上车刷卡,下车也刷卡,毫无疑问你就得到了真实的从哪路上车哪路下车,这也是非常了解公共交通出行的方式。我们通过这个数据可以看哪块换乘量比较大,这块反过来和拥堵计算一对比,还是有相当的关系。当然还有土地密集度上,这块岗位多人口也多,当然就拥堵了。我们就用到交通拥堵的特征分析上,因为在轨道刷卡也是上车刷卡出站也刷卡,你自然就得到了每个站点上车量、下车量、换乘量等等。

还有一个是出租车方面的应用,出租车主要是得到浮动车,还有翻计价牌的位置信息,就可以得到出租车出行的方式,比如说早高峰,南二环、中关村、西二旗出行速度比较低,晚高峰四环8.8公里,五环外是9.9公里,五环外是12.6公里,这是和我们数据相互校核。

另外是信令数据,最到我们在2010年试图和移动公司联合使用这个信令数据,但是信令数据应该这几年才发展的比较成熟,为什么?前几年我们获得信令数据最大的点就是在北京市所有地方都不是做的非常好,2010年我们采集信令数据的时候整个东南区片都没有,因为这是整个渐进的过程,因为你没有数据就不会应用,不会应用就不会促进运营商对数据采集的过程。