中国IDC圈4月27日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。
其中,在4月27日下午“大数据与城市交通”分论坛上,清华大学土木工程系、交通研究所李萌博士发表了精彩演讲。
清华大学土木工程系、交通研究所李萌
以下为李萌演讲实录:
李萌:各位来宾,首先非常感谢大会组织者邀请我来参与大会,今天也想在这边跟大家分享几个我们应用交通领域的模型跟数据挖掘模型结合怎么样更好的服务于民众和提升他们的管理效率。
今天可能分四个部分,首先非常简要的讲一下研究背景,大家都了解的。然后从三个方面讲一些我们的成果,包括从交通拥堵分析,交通排放分析,和可以应用到的一些交通分析管理措施。
从研究者层面,大家看到了,不光是国内,还有国外,包括交通拥堵问题,包括产生连带的排放问题和交通安全问题。在这里面我们几个角度分析,包括我们从交通瓶颈分析,去分析我们交通拥堵所产生的一些根本的根源在哪里,产生的原因在哪里。产生拥堵,产生了多少交通拥堵,这些拥堵又造成多少排放,进行排放分析,这这里我们服务于管理部门建议有哪些措施。
首先对于交通分析,对于北京城市来说,到处都在拥堵,拥堵起因在哪里,关键点在哪儿?这就是我们交通瓶颈分析。首先回答第一个问题,如何寻找到产生交通拥堵的关键问题关键瓶颈,首先第一个如何评价交通状态。传统来讲我们一方面看到互联网企业用速度表达,我们温主任这边用非常广的交通指数,从我们交通理论分析来说我们看到的交通状况应该从哪些方面分析。对于我们传统交通领域来说,我们构建的基本关系就是有一个关键点,就是交通系统达到饱和能力的时候会出现一些不稳定的现象,这个是关键节点,这个节点里面看到它的饱和通行能力达到一个关键指标,另外一个它的速度达到关键指标。达到饱和和评判非饱和关键速度用它评价饱和还是未饱和,这个层面我们能够有效的帮助管理者提升他们的管理水平。
这里我们两个数据,一方面来自高德,高德给我们提供大量的浮动车,包括手机APP大量的信息,这里面信息实际上对于我们传统,因为我们传统交通管理信息是离散断面的信息,断面的信息是全流量全样本信息,但是只是在少数断面的信息采集,但是如果得到“互联网+”大数据浮动车的数据,它虽然是抽样的,但是可以连续变速的信息,我们可以观察整个交通运行变化。这下面这张图是流量跟速度的代表图,我们看到整个交通流向变化规律从进速区,流量进入饱和区,进入饱和区过渡状态,然后速度流量再进一步增加速度会下降,进入过饱和状态,这边是未饱和状态,所以我们通过大量数据采集,分析在不同状态,主要我们分析快速路,从不同节点表现出来的状态,这些状态都是不一样的,我们看到有些图,从非饱和进入到饱和状态过渡阶段实际上存在大量的离散信息分布,有些节点实际上出现未饱和和过饱和状态中非常快速的过渡,我们没有看到在过渡区有大量速度的分离,这是为什么产生,所以我们在这里面进一步分析,包括我们用模式识别方法分析出过饱和和未饱和过渡状态的时候有哪些特别的类型。在这里面我们用过饱和概率去判断我们整个的概率分布。什么叫过饱和概率?在我们这一个图里面,这一部分是过饱和状态,这一部分是未饱和状态,我们在所有交通状态里面,过饱和状态和所有状态的百分比,我们所有采集的信息里面有多少比例是在这个点处于不饱和状态。如果这个过饱和状态过高,表明这个点会经常或者高概率出现饱和情况,我们展开这个对二环所有分析,二环不同节点展开分析,我们看到不同节点表现出了不同的现象,这是我们用一个季度的全数据表达出来的。