面向道路实时速度估算的浮动车载客行为模式清洗方法技术

技术编号:14895847 阅读:32 留言:0更新日期:2017-03-29 11:02
本发明专利技术公开了一种面向道路实时速度估算的浮动车载客行为模式清洗方法,包括如下步骤:步骤(1).读取浮动车历史数据,得到“类载客行为”速度变化阈值;步骤(2).读取路网数据,根据路段的连通性得到路口路段映射表,步骤(3).得到该时间片各个路段上各个车辆的速度列表;步骤(4).剔除速度列表中由于该行为形成的异常速度样本,并返回新的速度列表;步骤(5).剔除速度列表中由于“类载客行为”造成的异常速度样本,并返回新的速度列表;步骤(6).计算所有速度样本的平均速度作为该路段的实时速度并存于数据库实时速度表中。本发明专利技术在保证数据的实时性的同时,极大的增加了实时速度的准确性。

【技术实现步骤摘要】

本专利技术属于数据挖据
,具体涉及到一种面向道路实时速度估算的浮动车载客行为模式清洗方法。
技术介绍
交通拥堵问题伴随着社会、经济的飞速发展而日益严重。缓解交通问题迫在眉睫。随着“互联网+”的提出,各类智慧交通系统如雨后春笋般出现。各类智慧交通系统服务通过合理的管理、诱导道路上的车流可以快速和有效的缓解道路拥堵问题。以上各类智能交通服务的质量严重依赖于准确的、实时的路段速度,路段速度是以上各类服务的基础性参数。因此,本专利即是针对此参数的准确性开展的进一步深入讨论,通过过滤浮动车载客行为,进一步提高路段速度的准确性。由于浮动车数据具有低沉本、易获得性、覆盖广等特点,被广泛应用于各类智能交通服务。对现有海量的浮动车数据进行分析研究时可以发现,浮动车的载客行为产生的速度样本如果不进行剔除会严重影响路段速度的准确性。由于浮动车数据巨大,实时性非常强,人工很难及时发现并剔除载客行为产生的速度样本。本专利将要讨论的载客行为较出租车停车载客具有更加广泛的含义,主要包括导致浮动车数据梯度下降,然后再梯度上升的行为过程,如图1所示,发生此类行为时,有可能是真实的载客行为,有可能是避让行为,也有可能是寻客等待行为、路口红灯等待、斑马线礼让行人等等。在剔除此类行为过程中,还需要防止误剔除,如路口红灯等待,斑马线礼让行人等等代表了路段当前真实情况的行为。行业内的少数研究者关注了停车行为对路段速度估算的影响,对于本专利提出的更加广泛的类载客行为尚未涉及。
技术实现思路
本专利技术针对现有技术的不足,提出了一种面向道路实时速度估算的浮动车载客行为模式清洗方法。本专利技术中所谓的浮动车数据是指安装在城市公共交通工具(多指出租车)上的GPS设备每隔一段时间(一般30秒一次)上传至数据中心的数据。浮动车数据字典包括:车牌号码、车辆位置信息、数据创建时间、车辆载客状态(0表示空载,1表示满载)等;“载客行为”是指如图1所示的车辆由正常行驶突然减速后恢复正常行驶的过程。“载客行为”包括:“真载客行为”:是指从浮动车数据上表现出来的,即车辆载客状态由0变为1或者由1变为0的过程。该过程产生的速度样本需要剔除。“类载客行为”:是从车辆速度上表现出来的,表现为车辆速度变化类似于真实的载客行为,但是它的车辆载客状态并没有发生0,1跳变。我们称之为“类载客行为”。如路口等待红绿灯、遇突发事件、真实发生了载客行为但设备故障没有发生0,1跳变等等。“类载客行为”还根据发生时的不同情景分为以下各种行为:“路口行为”:指车辆的“类载客行为”发生在路口区域。多数情况下在路口等待红绿灯时发生,属于正常的交通行为无需剔除。“集体行为”:指所有车辆在同一时空范围内且在非路口区域均发生了“类载客行为”。这种行为多发生在道路临时拥堵,或斑马线前的礼让行人,属于道路正常现象无需剔除。“个体行为”:该行为是相对于“集体行为”而言的。该类行为产生的速度样本需要被剔除。本专利技术技术方案的主要构思:离线阶段,根据大量浮动车历史数据学习得到“类载客行为”的速度变化阈值,对路网数据进行预处理。在线阶段,实时获取一定时间片的浮动车数据,计算出浮动车行驶速度并添加到路网相应的路段中,从路段中的各个车辆的速度列表中剔除“真载客行为”的速度样本,并且根据“类载客行为”速度变化阈值识别“类载客行为”并剔除需要剔除的速度样本。本专利技术方法包括以下步骤:步骤(1).读取浮动车历史数据,浮动车数据包括车牌号码、位置信息、创建时间、载客状态,计算车辆连续两次记录的距离和时间差,然后通过距离和时间差计算速度得到历史数据中所有车辆的速度列表,统计载客状态发生跳变时的速度样本,并得到“类载客行为”速度变化阈值;1-1.根据“车牌号码”、“创建时间”升序读取一段时间(大于1个小时)的浮动车历史数据,浮动车每个样本点数据包括车牌号码(CPHM)、位置信息(GPS_FDC)、创建时间(CJSJ)、载客状态(STATUS);1-2.计算每辆车连续两个样本点相隔的距离和时间差,并计算出每辆车连续一个小时的所有速度样本列表;1-3.记录所有车辆发生“真载客行为”(STATUS由0变1或由1变0)时速度变化前后的连续5个速度样本<v1,v2,v3,v4,v5>,并选取500组这样的速度样本;1-4.将每组速度样本根据最小二乘法拟合成2次曲线,则每组速度样本都有一条唯一的二次曲线f(x);对速度样本的时间进行无量纲化、坐标原点设定、坐标统一化。首先将5个样本的时间都用等距的数值5,10,15,20,25依次替代。其次,将所有曲线进行上下平移使得所有曲线都经过坐标原点。最终为每组样本得到在统一坐标下的唯一的一条曲线,公式(1)中的a和b可以唯一确定曲线的形状。这里我们选取a,b,v1-v5三个参数作为每条曲线的参数向量V(a,b,v1-v5);f(x)=ax2+bx..............(1)1-5.对每一组数据计算得到它的参数向量V(a,b,v1-v5),将这500个参数向量进行基于密度的聚类算法DBSCAN进行聚类,可以得到三类曲线,即载客行为过程前半部分、载客行为过程后半部分、载客行为全过程;1-6.获取3个类的类簇中心的参数向量Vic(a,b,v1-v5)和最远边界的参数向量Vib(a,b,v1-v5)。根据公式(2)计算聚类中心参数向量和最远边界参数向量的欧式距离;1-7.根据以上步骤得到的三个类的距离D1,D2,D3作为“类载客行为”的速度变化阈值;步骤(2).读取路网数据,路网数据包括路段编号、路段位置信息,将路网网格化得到“网格—路段编号”映射表,并根据路段的连通性得到路口路段映射表;步骤(3).根据“车牌号”、“创建时间”升序读取当前时间前5分钟的浮动车数据,计算车辆连续两个样本点的相隔距离和时间差,然后通过距离和时间差计算速度,并根据“网格—路段编号”映射表将该速度添加到第二次记录的车辆位置信息所在的路段编号上,得到该时间片各个路段上各个车辆的速度列表;步骤(4).根据车辆载客状态识别“真载客行为”并剔除速度列表中由于该行为形成的异常速度样本,并返回新的速度列表,过程如下:4-1.循环读取LDIDSpeedListMap中下一个LDID中所有车牌号码CPHM对应的速度列表speedList;4-2.识别每一个speedList中,是否存在STATUS由0变1或者由1变0的过程,若存在则剔除跳变时产生的速度样本;4-3.重复步骤4-1,4-2直至LDIDSpeedListMap中所有LDID中的所有车牌号码CPHM对应的速度列表speedList都剔除完毕,并返回一个新的LDIDSpeedListMap;步骤(5).根据步骤(1)得到的阈值识别“类载客行为”,并剔除速度列表中由于“类载客行为”造成的异常速度样本,并返回新的速度列表,过程如下:5-1.经过步骤(4)后从新的LDIDSpeedListMap中循环遍历获取LDID中CPHM的速度样本列表speedList,以5个连续的速度样本为一组<v1,v2,v3,v4,v5>;5-2.将每组速度样本根据最小二乘法拟合成2次曲线,则每组速度样本都有一条唯一的二次曲线f(x),f(x)=ax2+bx,a、b为系数,每一组速度样本建立参数向量Vis(a本文档来自技高网...
面向道路实时速度估算的浮动车载客行为模式清洗方法

【技术保护点】
面向道路实时速度估算的浮动车载客行为模式清洗方法,其特征在于该方法的具体步骤是:步骤(1).读取浮动车历史数据,浮动车数据包括车牌号码、位置信息、创建时间、载客状态,计算车辆连续两次记录的距离和时间差,然后通过距离和时间差计算速度得到历史数据中所有车辆的速度列表,统计载客状态发生跳变时的速度样本,并得到“类载客行为”速度变化阈值;1‑1.根据“车牌号码”、“创建时间”升序读取一段时间的浮动车历史数据,浮动车每个样本点数据包括车牌号码CPHM、位置信息GPS_FDC、创建时间CJSJ、载客状态STATUS;1‑2.计算每辆车连续两个样本点相隔的距离和时间差,并计算出每辆车连续一个小时的所有速度样本列表;1‑3.记录所有车辆发生“真载客行为”,即STATUS由0变1或由1变0时速度变化前后的连续5个速度样本<v1,v2,v3,v4,v5>,并选取500组这样的速度样本;1‑4.将每组速度样本根据最小二乘法拟合成2次曲线,则每组速度样本都有一条唯一的二次曲线f(x);对速度样本的时间进行无量纲化、坐标原点设定、坐标统一化;首先将5个样本的时间都用等距的数值5,10,15,20,25依次替代;其次,将所有曲线进行上下平移使得所有曲线都经过坐标原点;最终为每组样本得到在统一坐标下的唯一的一条曲线,公式(1)中的a和b可以唯一确定曲线的形状;这里我们选取a,b,v1‑v5三个参数作为每条曲线的参数向量V(a,b,v1‑v5);f(x)=ax2+bx..............(1)1‑5.对每一组数据计算得到它的参数向量V(a,b,v1‑v5),将这500个参数向量进行基于密度的聚类算法DBSCAN进行聚类,可以得到三类曲线,即载客行为过程前半部分、载客行为过程后半部分、载客行为全过程;1‑6.获取3个类的类簇中心的参数向量Vic(a,b,v1‑v5)和最远边界的参数向量Vib(a,b,v1‑v5);根据公式(2)计算聚类中心参数向量和最远边界参数向量的欧式距离;Di=(Vic.a-Vib.a)2+(Vic.b-Vib.b)2+(Vic.(v1-v5)-Vib.(v1-v5))2...(2)]]>1‑7.根据以上步骤得到的三个类的距离D1,D2,D3作为“类载客行为”的速度变化阈值;步骤(2).读取路网数据,路网数据包括路段编号、路段位置信息,将路网网格化得到“网格—路段编号”映射表,并根据路段的连通性得到路口路段映射表;步骤(3).根据“车牌号”、“创建时间”升序读取当前时间前5分钟的浮动车数据,计算车辆连续两个样本点的相隔距离和时间差,然后通过距离和时间差计算速度,并根据“网格—路段编号”映射表将该速度添加到第二次记录的车辆位置信息所在的路段编号上,得到该时间片各个路段上各个车辆的速度列表;步骤(4).根据车辆载客状态识别“真载客行为”并剔除速度列表中由于该行为形成的异常速度样本,并返回新的速度列表,过程如下:4‑1.循环读取LDIDSpeedListMap中下一个LDID中所有车牌号码CPHM对应的速度列表speedList;4‑2.识别每一个speedList中,是否存在STATUS由0变1或者由1变0的过程,若存在则剔除跳变时产生的速度样本;4‑3.重复步骤4‑1,4‑2直至LDIDSpeedListMap中所有LDID中的所有车牌号码CPHM对应的速度列表speedList都剔除完毕,并返回一个新的LDIDSpeedListMap;步骤(5).根据步骤(1)得到的阈值识别“类载客行为”,并剔除速度列表中由于“类载客行为”造成的异常速度样本,并返回新的速度列表,过程如下:5‑1.经过步骤(4)后从新的LDIDSpeedListMap中循环遍历获取LDID中CPHM的速度样本列表speedList,以5个连续的速度样本为一组<v1,v2,v3,v4,v5>;5‑2.将每组速度样本根据最小二乘法拟合成2次曲线,则每组速度样本都有一条唯一的二次曲线f(x),f(x)=ax2+bx,a、b为系数,每一组速度样本建立参数向量Vis(a,b,v1‑v5),并根据公式(3)计算Vis与步骤(1)中得到三个类簇中心的参数向量Vic(a,b,v1‑v5)的欧式距离di(d1,d2,d3);di=(Vis.a-Vic.a)2+(Vis.b-Vic.b)2+(Vis.(v1-v5)-Vic.(v1-v5))2...(3)]]>5‑3.将di(d1,d2,d3)与步骤(1)中得到的对应的“类载客行为”速度变化阈值Di(D1,D2,D3)比较,如果d1<D1则认为该组速度样属于第一类“类载客行为”;d2<D2则认为该组速度样属于第二类“类载客行为”;d3类推;每个样本将唯一对应一个类,不会出现同时属于2个类的情况;5‑4.扫描speedList表,得到该...

【技术特征摘要】
1.面向道路实时速度估算的浮动车载客行为模式清洗方法,其特征在于该方法的具体步骤是:步骤(1).读取浮动车历史数据,浮动车数据包括车牌号码、位置信息、创建时间、载客状态,计算车辆连续两次记录的距离和时间差,然后通过距离和时间差计算速度得到历史数据中所有车辆的速度列表,统计载客状态发生跳变时的速度样本,并得到“类载客行为”速度变化阈值;1-1.根据“车牌号码”、“创建时间”升序读取一段时间的浮动车历史数据,浮动车每个样本点数据包括车牌号码CPHM、位置信息GPS_FDC、创建时间CJSJ、载客状态STATUS;1-2.计算每辆车连续两个样本点相隔的距离和时间差,并计算出每辆车连续一个小时的所有速度样本列表;1-3.记录所有车辆发生“真载客行为”,即STATUS由0变1或由1变0时速度变化前后的连续5个速度样本<v1,v2,v3,v4,v5>,并选取500组这样的速度样本;1-4.将每组速度样本根据最小二乘法拟合成2次曲线,则每组速度样本都有一条唯一的二次曲线f(x);对速度样本的时间进行无量纲化、坐标原点设定、坐标统一化;首先将5个样本的时间都用等距的数值5,10,15,20,25依次替代;其次,将所有曲线进行上下平移使得所有曲线都经过坐标原点;最终为每组样本得到在统一坐标下的唯一的一条曲线,公式(1)中的a和b可以唯一确定曲线的形状;这里我们选取a,b,v1-v5三个参数作为每条曲线的参数向量V(a,b,v1-v5);f(x)=ax2+bx..............(1)1-5.对每一组数据计算得到它的参数向量V(a,b,v1-v5),将这500个参数向量进行基于密度的聚类算法DBSCAN进行聚类,可以得到三类曲线,即载客行为过程前半部分、载客行为过程后半部分、载客行为全过程;1-6.获取3个类的类簇中心的参数向量Vic(a,b,v1-v5)和最远边界的参数向量Vib(a,b,v1-v5);根据公式(2)计算聚类中心参数向量和最远边界参数向量的欧式距离;Di=(Vic.a-Vib.a)2+(Vic.b-Vib.b)2+(Vic.(v1-v5)-Vib.(v1-v5))2...(2)]]>1-7.根据以上步骤得到的三个类的距离D1,D2,D3作为“类载客行为”的速度变化阈值;步骤(2).读取路网数据,路网数据包括路段编号、路段位置信息,将路网网格化得到“网格—路段编号”映射表,并根据路段的连通性得到路口路段映射表;步骤(3).根据“车牌号”、“创建时间”升序读取当前时间前5分钟的浮动车数据,计算车辆连续两个样本点的相隔距离和时间差,然后通过距离和时间差计算速度,并根据“网格—路段编号”映射表将该速度添加到第二次记录的车辆位置信息所在的路段编号上,得到该时间片各个路段上各个车辆的速度列表;步骤(4).根据车辆载客状态识别“真载客行为”并剔除速度列表中由于该行为形成的异常速度样本,并返回新的速度列表,过程如下:4-1.循环读取LDIDSpeedListMap中下一个LDID中所有车牌号码CPHM对应的速度列表speedList;4-2.识别每一个speedList中,是否存在STATUS由0变1或者由1变0的过程,若存在则剔除跳变时产生的速度样本;4-3.重复步骤4-1,4-2直至LDIDSpeedListMap中所有LDID中的所有车牌号码CPHM对应的速度列表speedList都剔除完毕,并返回一个新的LDIDSpeedListMap;步骤(5).根据步骤(1)得到的阈值识别“类载客行为”,并剔除速度列表中由于“类载客行为”造成的异常速度样本,并返回新的速度列表,过程如下:5-1.经过步骤(4)后从新的LDIDSpeedListMap中循环遍历获取LDID中CPHM的速度样本列表speedList,以5个连续的速度样本为一组<v1,v...

【专利技术属性】
技术研发人员:李万清方飞张迪刘辉俞东进袁友伟
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1