好文档 - 专业文书写作范文服务资料分享网站

用出租车GPS数据分析深圳市道路交通况

天下 分享 时间: 加入收藏 我要投稿 点赞

用出租车GPS数据分析深圳市道路交通况

用出租车GPS数据分析深圳道路交通情况

摘要

随着城市经济的发展,城市交通量不断增大,出租车通过安装GPS终端,将交通信息反馈给管理中心,为城市交通进行合理的规划做出了贡献。本文利用深圳市出租车GPS数据,解决了交通小区的划分,OD时空分布的计算和预测等问题。

针对问题一,由于数据量庞大,本文选取2011/4/19一天的数据进行处理。选取车辆状态status从0变为1,从1变为0对应的坐标分别作为出租车载客的起讫点,对数据进行筛选。根据筛选后的数据,利用出租车起讫点的密集程度用基于密度的聚类算法—DBSCAN聚类进行交通小区的划分,得到划分图。针对起讫点过于密集且没有进行划分的区域,结合深圳市交通地图,采用K-Means空间聚类对这些地区进行细分,最后将深圳市划分为A-K等11个交通小区,划分结果见图6,对比深圳市行交通地图发现本文划分的小区与其大致吻合。本文通过计算小区内各点经纬度的平均值作为小区的坐标。如A区坐标:(114.23,22.56)。

针对问题二,本文用OD矩阵表示OD时空分布,选取2011/4/19,7:40时刻做具体计算说明。首先计算出该时刻下,车辆状态status为1,即出租车重载或者开始载人的地点与各小区坐标的马氏距离,选取马氏距离较小的小区作为载客出租车起点的所属小区,追踪载客出租车的讫点,用同样的方法计算出讫点所属小区。对到达每个小区的车次进行累加求和,即可得到该时刻各小区之间的交通量,即OD时空分布。例如7:40从E区前往K区的人数为130。用同样方法可以计算出任意时刻载客出租车的OD时空分布。 针对问题三,首先建立居民出行选择出租车作为交通工具的概率随小区间距离变化的隶属度函数,计算出各小区之间居民选择出租车来往的概率。然后挑选出居民出行特征明显的五个时刻:1:20,7:40,12:30,17:30,21:30,分别计算载客出租车的OD时空分布,之后根据各小区之间出租车通行的概率求解出居民出行的OD时空分布。最后统计其他部分时刻的居民出行总量,得到2011/4/19一天的居民出行量随时间的变化曲线,得出早上8点左右和下午6点左右是居民出行的高峰期。在此基础上,基于信息熵对居民出行分布的均衡性进行了分析,得出夜间和午间居民出行相对均衡。

针对问题四,本文设定路口、路段车辆的平均行驶速度分别小于10km/h、20km/h时,认为拥堵。对载客出租车的行驶方向进行分析,确定出路口和路段位置。将2011/4/19除去居民出行较少的时间段21:00-7:00的其余时间按两个小时为间隔,划分为7个时间段。分别计算出各个时间段内,行驶在同一路段或路口所有载客出租车的平均速度,按照拥堵标准确定出各个时间段得拥堵路段和路口,得到拥堵图。通过分析7个拥堵图发现,大量路口和路段在7:00-9:00和17:00-19:00处于十分拥堵的状态,在11:00-13:00和19:00-21:00处于拥挤的路口

1 / 25

用出租车GPS数据分析深圳市道路交通况

和路段相对较少,其他时间基本没有出现拥堵情况。

关键词: DBSCAN聚类 K-Means OD矩阵 隶属度函数 信息熵

一、问题重述

各大城市出租车越来越多的安装了GPS终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位置、速度和方向等信息,是车辆GPS实时数据。原始数据主要保存出租车上装配的GPS终端所采集的数据,这些数据包括序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向(8个方向)等信息。附注网站提供了深圳市出租车GPS数据,从这些数据你是否能够:

1. 根据出租车载客的起讫点,结合深圳市的交通地图,恰当的划分交通小区,并选择小区中的某一点,用其经纬数值作为该小区的坐标。

2. 根据小区划分和出租车GPS数据,给出载客出租车的OD时空分布。如:某时刻从坐标(i,j)到(i?,j?)、(i??,j??)的出租车有多少辆。

3. 由此,在合理的假设条件下,能否对人们出行的OD时空分布进行推断? 4. 根据出租车载客后的行驶数据,筛选出拥堵的路段时段以与拥堵的路口时段。拥堵的标准自己设定,如某路段在某个时段平均行驶速度小于多少公里/小时(比如,10公里/小时),可认为是拥堵。

二、问题分析

2.1交通小区的概念

交通诱导是均衡一定区域的交通流量,区域控制是对一定数量交叉口的协调控制。将这个有限的交通区域称之为交通小区。交通小区是具有一定交通关联度和交通相似度的节点或连线的集合,随时间、关联度和相似度的变化而变化 ,反映城市路网交通特征的时空变化特性。交通小区具有同质性关联性、动态性、稳定性、自组织性等特性[1]。

交通小区的划分是分析城市交通网络的一个很好的方式,因为交通小区内具有相似的交通特征和较强的交通关联性交通小区的划分与该城市的人口 面积 经济特征 产业结构等密切相关,并在一定程度上反应了一个城市的吸引力。一般来说,交通小区的划分应该遵循以下原则[2]: (1)分区内的经济、社会等特性尽量一致;

(2)小区划分尽量不打破行政区的划分,以便可以利用行政区的统计资料; (3)尽量以铁路、河川等天然屏障作为分界线,尽可能避免小区内存在人为或自然障碍线; (4)分区数量适当,中等城市不超过 50 个,大城市最多不超过100- 150 个 数量太多将加重规划的工作量,数量太少又会降低调查和分析的精度; (5)小区尽可能规整,避免狭长形状。

本文主要针对深圳市的具体情况划分交通小区。从资料中得到深圳市行政区划分图为:

2 / 25

用出租车GPS数据分析深圳市道路交通况

深圳市行政区划分图

2.2问题一的分析

问题一要求根据出租车载客的起讫点,结合深圳市的交通地图,恰当地划分交通小区,并确定小区的经纬度。首先对数据进行分析,发现这是一份相当庞大且很全面的数据,同时也存在划分小区时所用不到的信息。GPS终端采集的数据包括序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向等信息。本题需要得到出租车起讫点的信息。所以只需挑选出车辆状态从空车变为重车,重车变为空车时对应的数据。根据起讫点的经纬度确定出租车的位置,毫无疑问是大量的二维的样本点,想到用聚类的方法按照出租车起讫点的密集程度将深圳市划分为几个交通小区,然后可以选择小区内各点经纬度的平均值作为小区的坐标。 2.3问题二的分析

问题二需要在第一问的交通小区划分的基础上,给出载客出租车的OD时空分布。OD时空分布就是某时刻各小区之间的交通量分布。本文选取居民出行量较多的上班时刻2011/4/19,7:40,来计算各个小区之间的出租车通行量。首先得确定出该时刻下有哪些出租车处于载人状态或者开始载人,然后确定这些出租车在这个时刻处于哪个小区,接着追踪乘客的目的地,确定目的地在哪个小区。对到达各个小区的出租车辆数进行累加求和,即可得到该时刻载客出租车的OD时空分布。 2.4问题三的分析

在前两问的基础上可以求出载客出租车的OD时空分布,如果要对人们出行的OD时空进行推断,首先得知道居民出行时有多大可能选择乘坐出租车,即得到各个小区之间居民乘坐出租车来往的概率分布,可以考虑建立居民出行基于距离而考虑选择出租车的隶属度函数。然后根据已知的载客出租车的OD时空分布,除以对应的概率,即可得到人们的总的出行OD时空分布。 2.5问题四的分析

衡量路段或路口的标准有很多种,这里选择路段或路口的平均速度来判断某

3 / 25

用出租车GPS数据分析深圳市道路交通况

路段或某路口是否拥堵。在路口时,由于行驶方向较多,并且设置红绿灯,交通相对复杂,出租车的行驶速度也会放慢,所以设定路口行驶车辆的平均速度小于10km/h时,认定其会导致路段拥堵。在路段行驶时,来往车辆按两个方向进行行驶,交通较为顺畅,所以设定路段行驶车辆的平均速度小于20km/h时,认为其导致路段拥堵。本文将2011/4/19等间隔分成一些时间段。通过出租车行驶方向是否变化来判断路口和路段位置,分别计算出路口路段车辆的平均行驶速度,确定出拥堵的路口路段,得到各个时间段得交通拥堵图。

三、模型假设

1、假设深圳市在采集数据的时间内没有出现阻碍或促进居民出行的情况,例如一些活动;

2、假设地球是规则的球体;

3、假设居民出行选择出租车时只考虑距离的长短;

4、假设出租车的在路段平均行驶速度小于20km/h时导致路段拥堵; 5、假设出租车在楼口的平均速度小于10km/h时导致路口拥堵;

四、符号说明

符号 name time jd wd status v angle xi yi 说明 车牌号 采集时间点 经度 纬度 车辆状态 车速 行车方向 出租车载客起讫点的经度 出租车载客起讫点的纬度 交通小区坐标 ?x,y? ??4 / 25

用出租车GPS数据分析深圳市道路交通况

odij 从小区i出发去往小区j的的所有车次 小区个数 小区中样本点的个数 两个小区之间的距离 在某两个小区之间居民乘坐出租车的概率 n m l p 注:status为0时表示车辆非打表,即空载,为1时表示已打表,即重载;angle分别为 0=东;1=东南;2=南;3=西南;4=西;5=西北;6=北;7=东北;其他符号在文中出现处予以说明。

五、模型的建立与求解

5.1问题一的求解

交通小区是为了减少交通控制和管理系统的复杂性提出的,为了减少交通控制,一些交通相似的地区所组成的紧密区域可以作为一个交通小区。载客出租车的起始地点和目的地就是交通密集的地方,根据载客出租车起讫点的密集程度用聚类算法方法将深圳市划分为若干个交通小区,在根据小区内各点经纬度的平均值确定小区的坐标。 5.1.1 数据处理

由于题目所给数据时时间段为2011/04/18—2011/4/26,车辆总数为13798的GPS数据,数据量十分庞大,基于缩短数据查询时间与提高整体运算性能等方面,本题选取时间段为2011/4/19,8:00—9:00的数据。

GPS终端采集的数据包括序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向等信息。本题需要得到出租车起讫点的信息。数据中车辆状态status为0时表示出租车空载,为1时表示重载,所以当status从0变为1时,status值为1的位置即为乘客上车的位置,视为起点;status从1变为0时,status值为0的位置即为乘客下车的位置,视为讫点。针对车辆粤B000H6做如下具体说明:

从数据表中挑选出的2011/4/19,8:00—9:00时段的部分原始数据如下:

表1:部分原始数据

name 粤B000H6 粤B000H6 粤B000H6 粤B000H6 粤B000H6 粤B000H6 粤B000H6

time 2011/4/19 2011/4/19 2011/4/19 2011/4/19 2011/4/19 2011/4/19 2011/4/19

8:08:31 8:08:53 8:12:18 8:18:50 8:19:20 8:44:58 8:45:20

jd 114.0842 114.0811 114.0639 114.054 114.0542 114.0493 114.0493

wd 22.571 22.57247 22.57123 22.57888 22.5784 22.52568 22.52568

status 1 1 0 0 1 1 0

v 51 66 13 17 22 0 0

angle 6 6 0 3 3 2 2

5 / 25

用出租车GPS数据分析深圳市道路交通况

用出租车GPS数据分析深圳市道路交通况用出租车GPS数据分析深圳道路交通情况摘要随着城市经济的发展,城市交通量不断增大,出租车通过安装GPS终端,将交通信息反馈给管理中心,为城市交通进行合理的规划做出了贡献。本文利用深圳市出租车GPS数据,解决了交通小区的划分,OD时空分布的计算和预测等问题。针对问题一,由于数据量
推荐度:
点击下载文档文档为doc格式
5l09p0amyu670et7c26i4qfr01784a016nr
领取福利

微信扫码领取福利

微信扫码分享