近年来,随着无线通信的广泛应用,车辆GPS、手机信令、交通卡等空间行为大数据,被用来非常精确地揭示人类行为移动模式,从而解释城市的社会经济环境。如今,可利用的空间行为大数据已经包括:移动电话数据、车辆轨迹数据、智能卡数据、Wi-Fi和蓝牙数据、社交媒体用户数据等。
这些空间行为大数据,为确定人类的生活模式提供了一个非常有前途的来源。由于大数据可以记录连续的空间行为,且随时间和空间精确变化,研究使用这些数据,可以细致揭示城市居民个体不同空间和时间下的交通出行模式。
近几年,包含交通智能卡和手机运营商数据在内的城市轨迹大数据,正在国内外成为科学研究和商业应用的热点。随着数据处理、模型设计、统计验证方法的不断成熟,大数据正被不断应用到城市生活不同场景的实践中。
交通智能卡数据
交通智能卡(Smart card)最初应用于公共交通的自动收费系统,如公共汽车、地铁和停车场。智能卡系统也被引入商店、餐馆和医院。如今,几乎在世界各大城市都有自己的智能卡系统。
虽然交通智能卡的主要目的是收集收入信息,但同时也产生了大量非常详细的交易数据信息。这些数据既可以帮助公交系统的日常运营,也可以用于相关网络的长期战略规划。可实现三级管理的各种用途:战略(中长期规划)、战术(服务调整和网络发展)和运作(客流统计和绩效指标)。
一般,智能卡包含信息包括卡ID、交易数据(时间、类型和车费)、旅行数据(出行模式、时间、票价、车站和路线ID)和个人识别数据。因此,智能卡中的数据可以用于出行需求预测或个人出行模式检测。然而,不同于基于距离的票价,智能卡数据没有登记行程,仅有出入站地点。因此,使用智能卡数据的一个主要挑战,是如何识别一个完整的旅行轨迹、估计各种多通道传输的可能。
曾有学者使用伦敦智能卡数据中的个人旅行信息,揭示城市的结构,提供新的方法来模拟城市系统的流量;基于北京市14个工作日的地铁刷卡客流量数据,将195个地铁站点分为居住导向型、就业导向型、职住错位型、错位偏居住型、错位偏就业型、混合型、综合型及其他型8种不同类型;使用上海申通地铁数据,对世博会期间上海轨道交通客流特征进行统计分析。所有这些实证研究表明,智能卡数据对理解城市系统的动态(各种旅行行为和交通规划)非常有效。
国内外学者在公共交通中使用智能卡数据进行的研究,主要分为三大类:战略层面上,涉及长期的网络规划、客户行为分析和需求预测;战术层面上,重点是地铁时刻表调整、纵向和个别的出行模式;业务层面,研究相关的供应和需求指标,以及如何完善智能卡系统可操作性。一旦智能卡搭载上持卡人资料,比如采用使用者实名制登记,其所呈现的信息的社会人口属性会更强。
手机运营商数据
无论在国内还是国外,移动手机的运营商数据,作为一种轨迹数据,也已被广泛用于各类研究和商业应用。
手机数据有两种类型:基于信元塔的数据,主要包含小区塔流量和切换信息;基于移动电话的用户数据,通常包含匿名用户ID、小区塔ID,以及电话、位置、日期和时间的信息。目前,出于数据类型和研究目的的不同,用来处理和分析手机数据的方法,包括传统的数据挖掘技术,如聚类方法和基于规则的算法,新技术有可视化工具和复杂的机器学习方法。
手机数据在出行交通行为研究中最基本的应用是检测逗留(访问)和提取出行次数。通常情况下,结合连续定位数据和历史定位数据、计算个体在每个区域的定位频率,可以检测该用户的停留情况。只需要手机使用的四个时空点,就能定义一个人的活动痕迹。
用户的交通方式,可以使用蜂窝网络的数据,根据连接信号强度的波动变化率,做较粗略的估计。目前通过这类数据可识别的出行方式,主要包括停止、步行和机动车出行方式。
范围更广的交通方式,可以使用手机内置的GPS和运动传感器,采集更准确的定位和运动状态信息,判断行驶速度和可能的方式。例如,利用智能手机内置GPS和加速度传感器收集的数据,可以确定五种运输方式,包括步行、跑步、骑自行车、停止、开车;区分八种出行方式,包括汽车、自行车、公共汽车、电车、火车、地铁、步行、摩托车等。应用于上述数据分析的分类技术,包括决策树分类器、隐藏的马尔可夫模型、基于规则的分类器、人工神经网络、贝叶斯分类器等。