一种基于卡口数据的职住位置估计方法技术

技术编号:18139344 阅读:58 留言:0更新日期:2018-06-06 12:24
本发明专利技术公开了一种车辆职住位置估计方法,所述方法包括:步骤(1)获取卡口数据并对卡口数据进行预处理;步骤(2)划分车辆行程;步骤(3)提取重要记录点;步骤(4)使用改进后的k‑means聚类算法,对样本点进行聚类。可以有效估计出车辆的家庭位置,为进一步分析车辆出行特征等奠定基础。

【技术实现步骤摘要】
一种基于卡口数据的职住位置估计方法
本专利技术涉及交通领域,尤其涉及一种基于卡口数据的职住位置估计方法。
技术介绍
卡口设备是安置在交通枢纽道路的以摄像机为依托的软硬件相结合的对道路实施监控的智能管控设备,可以全天24小时记录经过车辆信息,包括车牌号,过车时间,行驶方向等,为车辆出行特征以及路网状态分析提供可靠的数据支撑。在出行特征中,如果知道车辆的职住位置,对于交通流量的预估等相关交通情况的分析和管控具有较大的意义。所述职住位置即工作(职)和住所(住)所在的位置。目前关于出行者OD(起点和终点)估计的方法有很多,其中申请号为201110163206.2的专利——《基于车辆自动识别设备的动态OD矩阵估计方法》主要通过以车辆的微观路径修复作为动态OD估计的主要手段,采用贝叶斯估计算法进行操作,上述技术方案使用的数据量大计算量大,对于硬件条件不能满足的环境下并不能够适用,其预测结果也有提高的空间。申请号为201310213953.1的专利——《基于智能公交系统数据的公交卡乘客通勤OD分布估计方法》主要基于三种居民出行特征假定,使用乘车频次统计方法和聚类分析方法推算居民OD,该方法受限于公交IC卡类的OD数据。
技术实现思路
本专利正是基于现有技术的上述需求而提出的,本专利要解决的技术问题是,本专利技术提出的基于卡口数据的车辆职住位置估计方法可以克服以上不足,结合卡口数据本身特性,实现车辆职住位置估计。为了解决上述技术问题,本专利提供的技术方案包括:一种车辆职住位置估计方法,所述方法包括:步骤(1)获取卡口数据并对卡口数据进行预处理;所述预处理包括:(1.1)数据降维从原始卡口数据中提取出卡口编号K,车牌号M,过车时间S,形式方向F,删除其余列数据;(1.2)数据重组首先按照车牌号分组;将所有数据按照车牌号M分组,即将车牌号相同的数据放入一个集合中Mi={Mi1,Mi2,…,Min},其中Min表示车牌号为Mi的车辆的第n条数据;其次,按过车时间排序;然后,按照过车时间S对相同车牌号的数据进行排序,得到按时间顺序排列的车辆数据集合Mis={Mis1,Mis2,…,Misn},其中Misn表示车牌号为Mi的车辆的第n条数据;(1.3)数据清洗删除未识别数据;删除重复记录;步骤(2)划分车辆行程(2.1)基于数据记录时间间隔,对每个车辆每天记录点进行划分,划分成独立的行程;首先按照日期对数据集Mis中的数据分组,得到每辆车每天的轨迹数据集合Mid={Mid1,Mid2,…,Midn},其中Midn表示车牌号为Mi的车辆在第d天的第n条数据;(2.2)设置阈值B,划分记录点;根据车辆每天轨迹数据集Mid,计算相邻两记录点的时间差Δtd={Δtd1,Δtd2,…,Δtdn-1},并基于卡口数据与实际路网,设定阈值B,若Δtdi<B,则第i+1个记录点属于下一个行程,否则,属于当前轨迹集,由此得到每辆车每天的所有行程轨迹集,Mid={Mid1,Mid2,…,Midn};步骤(3)提取重要记录点选取车辆每天的第一个和最后一个行程,并提取其中的两类记录点:第一类为第一个行程的首个记录点和最后一个行程的最后一个记录点,记为A类;第二类为第一个行程的最后一个记录点和最后一个行程的第一个记录点,记为B类;并根据卡口编号和卡口实际位置经纬度坐标,将提取的记录点的经纬度坐标放入新的样本集P中,Pi={PAi,PBi},其中PAi表示第i辆车所有的A类记录点数据集;步骤(4)使用改进后的k-means聚类算法,对样本点进行聚类(4.1)改进k-means聚类算法的度量方法,采用球面距离代替K-means中的欧几里得距离来度量样本之间的相似性;球面距离的计算公式为:D(Pi,Pj)=R×arccos(a+b);其中,D(Pi,Pj)表示Pi点和点Pj之间的最短球面距离;R为地球半径;a=sin(PiLon×π/180)×sin(PjLon×π/180),PiLon为点Pi的经度,PjLon为点Pj的经度;b=cos(PiLat×π/180)×cos(PjLat×π/180)×cos(PjLon-PiLon),PiLat为点Pi的纬度,PjLat为点Pj的纬度;(4.2)设置聚类中心K,进行聚类分析,设置要生成的数据子集的数目k,将输入的数据集PAi划分为k类,得到数据集C={c1,…,ck},其中ck表示被划分到第k类的数据的集合;其中k的初始值从样本中随机选取,得到k类,从中选取包含样本数量最多的类max{C},将其聚类中心作为估计的家庭位置,同样从数据集PBi中聚类得到的聚类中心作为估计的工作位置。优选地,阈值B的计算具体如下:(1)获取m条路的所有路段的长度信息L={l1,…,lm},以及每条道路的最大允许速度V={v1,…,vm};(2)计算每个路段的旅行时间T={t1,…,tm},其中(3)B=max{T},从路网中所有路段的行程时间中找到最大值作为阈值B。本专利技术围绕探索性算法,基于卡口数据,提出一种基于车辆轨迹记录时间间隔的出行行程识别方法;本专利技术在时间间隔阈值B的计算中,充分考虑实际路网信息,并结合卡口数据计算道路旅行时间,保证阈值B的可靠性;本专利技术结合车辆通勤特征,从车辆单行程轨迹点出发,选取行驶过程中一系列“重要”记录点,作为位置估计样本集,并根据卡口数据本身特性,改进K-means算法中的欧氏距离为球面距离,对重要记录点进行聚类,降低了方法的复杂度;可以有效估计出车辆的家庭位置,为进一步分析车辆出行特征等奠定基础。附图说明图1为本专利技术具体实施方式中一种路网的结构示意图;图2为基于探索性算法的车辆行程划分示意图;图3为车辆出行行程轨迹点划分流程图;图4为车辆轨迹重要记录点示意图。具体实施方式下面结合附图和实施例对本专利技术做进一步的详细说明,使得本领域技术人员参照说明书文字能够据以实施。本具体实施方式提出了一种基于卡口数据的家庭位置估计方法,具体步骤如下:(1)对卡口数据进行预处理;对所述卡扣数据的预处理包括数据降维、数据从组、数据清洗。通过数据的预处理能够获取价值最大的数据内容,方便本方法的实施,提高本方法的准确性和效率。(1.1)数据降维原始卡口数据信息量大,而并不是所有信息都对于本具体实施方式是有用的。为提高分析效率,本具体实施方式中从卡口数据提取出关键信息、降低数据维度。具体而言,在本具体实施方式中,从原始的卡口数据中提取出卡口编号K,车牌号M,过车时间S,行驶方向F,删除其余列数据。(1.2)数据重组1.按照车牌号分组;将所有数据按照车牌号M分组,即将车牌号相同的数据放入一个集合中Mi={Mi1,Mi2,…,Min},其中Min表示车牌号为Mi的车辆的第n条数据。2.按过车时间排序;然后按照过车时间S对相同车牌号的数据进行排序,得到按时间顺序排列的车辆数据集合Mis={Mis1,Mis2,…,Misn},其中Misn表示车牌号为Mi的车辆的第n条数据。(1.3)数据清洗删除未识别数据;针对卡口数据中车牌号未能成功识别的记录,进行删除操作;删除重复记录;针对车辆连续被多次检测出现的重复记录,进行删除操作。一般认为是车牌号标记为“未识别”字样的数据和车牌号识别错误,例如乱码,的数据是车牌号未能成功识本文档来自技高网...
一种基于卡口数据的职住位置估计方法

【技术保护点】
一种车辆职住位置估计方法,其特征在于,所述方法包括:步骤(1)获取卡口数据并对卡口数据进行预处理;所述预处理包括:(1.1)数据降维从原始卡口数据中提取出卡口编号K,车牌号M,过车时间S,形式方向F,删除其余列数据;(1.2)数据重组首先按照车牌号分组;将所有数据按照车牌号M分组,即将车牌号相同的数据放入一个集合中Mi={Mi1,Mi2,…,Min},其中Min表示车牌号为Mi的车辆的第n条数据;其次,按过车时间排序;然后,按照过车时间S对相同车牌号的数据进行排序,得到按时间顺序排列的车辆数据集合Mis={Mis1,Mis2,…,Misn},其中Misn表示车牌号为Mi的车辆的第n条数据;(1.3)数据清洗删除未识别数据;删除重复记录;步骤(2)划分车辆行程(2.1)基于数据记录时间间隔,对每个车辆每天记录点进行划分,划分成独立的行程;首先按照日期对数据集Mis中的数据分组,得到每辆车每天的轨迹数据集合Mid={Mid1,Mid2,…,Midn},其中Midn表示车牌号为Mi的车辆在第d天的第n条数据;(2.2)设置阈值B,划分记录点;根据车辆每天轨迹数据集Mid,计算相邻两记录点的时间差Δtd={Δtd1,Δtd2,…,Δtdn‑1},并基于卡口数据与实际路网,设定阈值B,若Δtdi<B,则第i+1个记录点属于下一个行程,否则,属于当前轨迹集,由此得到每辆车每天的所有行程轨迹集,Mid={Mid1,Mid2,…,Midn};步骤(3)提取重要记录点选取车辆每天的第一个和最后一个行程,并提取其中的两类记录点:第一类为第一个行程的首个记录点和最后一个行程的最后一个记录点,记为A类;第二类为第一个行程的最后一个记录点和最后一个行程的第一个记录点,记为B类;并根据卡口编号和卡口实际位置经纬度坐标,将提取的记录点的经纬度坐标放入新的样本集P中,Pi={PAi,PBi},其中PAi表示第i辆车所有的A类记录点数据集;步骤(4)使用改进后的k‑means聚类算法,对样本点进行聚类(4.1)改进k‑means聚类算法的度量方法采用球面距离代替K‑means中的欧几里得距离来度量样本之间的相似性;球面距离的计算公式为:D(Pi,Pj)=R×arccos(a+b);其中,D(Pi,Pj)表示Pi点和点Pj之间的最短球面距离;R为地球半径;a=sin(PiLon×π/180)×sin(PjLon×π/180),PiLon为点Pi的经度,PjLon为点Pj的经度;b=cos(PiLat×π/180)×cos(PjLat×π/180)×cos(PjLon‑PiLon),PiLat为点Pi的纬度,PjLat为点Pj的纬度;(4.2)设置聚类中心K,进行聚类分析设置要生成的数据子集的数目k,将输入的数据集PAi划分为k类,得到数据集C={c1,…,ck},其中ck表示被划分到第k类的数据的集合;其中k的初始值从样本中随机选取,得到k类,从中选取包含样本数量最多的类max{C},将其聚类中心作为估计的家庭位置,同样从数据集PBi中聚类得到的聚类中心作为估计的工作位置。...

【技术特征摘要】
1.一种车辆职住位置估计方法,其特征在于,所述方法包括:步骤(1)获取卡口数据并对卡口数据进行预处理;所述预处理包括:(1.1)数据降维从原始卡口数据中提取出卡口编号K,车牌号M,过车时间S,形式方向F,删除其余列数据;(1.2)数据重组首先按照车牌号分组;将所有数据按照车牌号M分组,即将车牌号相同的数据放入一个集合中Mi={Mi1,Mi2,…,Min},其中Min表示车牌号为Mi的车辆的第n条数据;其次,按过车时间排序;然后,按照过车时间S对相同车牌号的数据进行排序,得到按时间顺序排列的车辆数据集合Mis={Mis1,Mis2,…,Misn},其中Misn表示车牌号为Mi的车辆的第n条数据;(1.3)数据清洗删除未识别数据;删除重复记录;步骤(2)划分车辆行程(2.1)基于数据记录时间间隔,对每个车辆每天记录点进行划分,划分成独立的行程;首先按照日期对数据集Mis中的数据分组,得到每辆车每天的轨迹数据集合Mid={Mid1,Mid2,…,Midn},其中Midn表示车牌号为Mi的车辆在第d天的第n条数据;(2.2)设置阈值B,划分记录点;根据车辆每天轨迹数据集Mid,计算相邻两记录点的时间差Δtd={Δtd1,Δtd2,…,Δtdn-1},并基于卡口数据与实际路网,设定阈值B,若Δtdi&lt;B,则第i+1个记录点属于下一个行程,否则,属于当前轨迹集,由此得到每辆车每天的所有行程轨迹集,Mid={Mid1,Mid2,…,Midn};步骤(3)提取重要记录点选取车辆每天的第一个和最后一个行程,并提取其中的两类记录点:第一类为第一个行程的首个记录点和最后一个行程的最后一个记录点,记为A类;第二类为第一个行程的最后一个记录点和最后一个行程的第一个记录点...

【专利技术属性】
技术研发人员:于海洋杨帅刘帅任毅龙秦洪懋
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1