当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于卡口数据的车辆行为相似度计算方法技术

技术编号:20161135 阅读:22 留言:0更新日期:2019-01-19 00:13
本发明专利技术提供一种基于卡口数据的车辆行为相似度计算方法,首先收集移动对象通过各卡口的数据信息并建立数据库,然后在数据库中检索A、B车辆的卡口数据以形成两车的原始轨迹,对原始轨迹进行清洗和切割进而得到关于A、B车辆子轨迹的集合,然后根据LCSS算法对两个集合中的子轨迹进行两两比对,通过计算得到任意两条子轨迹间的最长公共子序列以及两车经过最长公共子序列中相邻卡口的时间差,得到两条子轨迹间的相似度,最后利用所有相似度数据进行多轨迹相似度计算,所得结果视为两车间的行为相似度。本发明专利技术在计算中引入了时间影响因子,所得结果更加精确且适用范围更广,同时还将轨迹相似度结果用于对车辆行为相似程度的判断。

【技术实现步骤摘要】
一种基于卡口数据的车辆行为相似度计算方法
本专利技术涉及移动对象的数据处理与分析
,具体地,涉及一种基于卡口数据的车辆行为相似度计算方法。
技术介绍
近年来,由于大数据监测系统的不断发展完善以及实际应用需求的逐年增加,针对移动对象轨迹数据的分析工作引起了越来越多的关注。轨迹数据实质上就是大量的轨迹点,而每一个轨迹点至少包括以下信息:对象、位置和时间;如果把同一对象在连续时间内的所有空间位置收集起来并标明,即可得到一条时空轨迹。目前,国内各大城市已建成了比较健全的信息化基础设施,为轨迹数据的收集和利用提供了海量数据资源和信息平台。随着各种各样轨迹数据的公开,众多学者开始将目光转向从轨迹数据中发掘有价值的信息,其中轨迹相似度的研究已经成为热点之一,其研究成果主要应用于轨迹聚类、路径模型、异常轨迹检测等方面,在道路交通监控和配合警方打击犯罪方面取得了很好的成效。在现有技术中,最常用的轨迹相似度计算方法包括欧式距离算法、Hausdorff距离算法、最长公共子序列算法、动态时间规整算法等。由于数据采集点均设置于卡口,位置特殊,因此通常采用最长公共子序列算法,但由于该算法中仅仅引入了空间容忍度(即经过卡口间的位置距离)而未考虑时间容忍度,因此存在缺陷:对于经过相同卡口但所用时间相差较大的不同轨迹,计算得到的多个相似度有可能高度近似,因而难以对分析结果起到实际作用。基于上述缺陷,现有的轨迹相似度计算方法结果可靠性差、适用范围小,更不用说在此基础上进一步延伸应用在对不同车辆行为相似度的分析判断上。
技术实现思路
本专利技术的目的在于提供一种使用方便、可靠性高、适用范围广的车辆行为相似度计算方法,以解决
技术介绍
中提出的问题。为实现上述目的,本专利技术提供了一种基于卡口数据的车辆行为相似度计算方法,包括如下步骤:步骤1):通过设置在各个卡口的数据采集装置获得移动对象通过卡口时的数据信息,对上述数据信息进行整合保存以形成数据库。利用治安卡口、电子警察等应用系统对通过的车辆进行监控和拍照,产生了大量的车辆通行记录,这些记录涵盖了车牌号码、通行时间、号牌颜色、卡口代码、车辆类型、行驶方向等车辆信息,保留HPHM、JGSJ、KKDM等字段作为表示移动对象位置的必要位置信息以形成数据库,其中HPHM表示车牌号码,KKDM表示每个监控卡口设备的唯一标识符,JGSJ指某个移动对象经过某卡口的时间信息。步骤2):根据A车辆的HPHM信息对数据库进行查询,得到若干个关于A车辆的卡口数据信息即轨迹点,将这些轨迹点按照时间顺序进行排序得到A车辆的原始轨迹。步骤3):对A车辆的原始轨迹进行清洗,对于在一定时间T内连续出现的相同卡口数据,过滤掉多余的重复数据。由于车辆在行进过程中不可避免地会出现堵塞排队、等待交通信号灯等意外情况,进而导致车辆长期停留在卡口的数据采集范围内,因此在一段时间内会出现多个连续且重复的卡口数据,即车辆的位置信息不随时间的变化而发生变化,此时需要将多余的卡口数据过滤掉以避免干扰。步骤4):将清洗后的轨迹分割成多段子轨迹,形成关于A车辆的n段子轨迹的集合。步骤5):针对B车辆重复上述步骤2)、步骤3)和步骤4),形成关于B车辆的m段子轨迹的集合。步骤6):对A、B车辆进行轨迹相似度计算,首先在两个集合中各取一条子轨迹,即TRA={<pa1,ta1>,<pa2,ta2>,...,<pan,tan>}(1)TRB={<pb1,tb1>,<pb2,tb2>,...,<pbm,tbm>}(2)其中,p代表车辆经过的某个卡口,t代表车辆通过p卡口的相应时刻且有tn-1<tn以及tm-1<tm,根据LCSS算法得到上述两个子轨迹间的最长公共子序列,即LC(TRA,TRB)={<pi,ti>,<pj,tj>,...,<pk,tk>}(3)然后计算分别得到A、B车辆经过最长公共子序列中相邻两卡口所需时间的集合,即ΔTA={<taj-tai>,...,<tak-taj>}(4)ΔTB={<tbj-tbi>,...,<tbk-tbj>}(5)其中,Δt=ti-tj(1<i,j<n,j<m,i<j),进而再分别得到A、B车辆经过最长公共子序列中相同相邻卡口所需时间差值的绝对值的集合,即ΔC={|Δtb1-Δta1|,|Δtb2-Δta2|,...|Δtbk-Δtak|}(6)ΔC={Δc1,Δc2,...,Δcn}计算时间影响因子,即根据上述公式计算两条子轨迹间的相似度,即其中,L(TRA)和L(TRB)分别为两条子轨迹的长度,LC(TRA,TRB)为两条子轨迹间最长公共子序列的长度,Sim的取值区间为[0,1],0表示两条子轨迹间毫无交集,1表示两条子轨迹在空间上完全重叠。步骤7):根据步骤6)完成对A、B车辆间任意两条子轨迹的相似度计算。步骤8):利用计算得到的轨迹相似度数据对A、B车辆间的行为相似度进行计算,即其中,NL(A)指A车的所有子轨迹数量,NL(B)指B车的所有子轨迹数量,S(A,B)为A车与B车的行为相似度,ε为设定的子轨迹相似度阈值,若子轨迹的相似度大于或等于阈值ε,则接受该相似度,反之则拒绝该相似度。优选地,所述步骤3)中的时间T≥1min。优选地,为了精简计算程序并提高计算结果的可靠性,在所述步骤4)中形成车辆的子轨迹集合时需要对所有子轨迹进行筛选,设定子轨迹长度阈值N,若子轨迹的长度大于或等于阈值N,则将该子轨迹放入集合中,反之则去除该子轨迹,不对该子轨迹做相似度的比对计算。优选地,所述子轨迹长度阈值N至少为3个卡口。优选地,所述步骤4)中的轨迹分割方法可采取按天分割、按周分割或行停分割中的任意一种;采用行停分割法时需设定时间阈值M,若车辆经过轨迹中相邻两卡口的时间间隔大于或等于阈值M,则认为两卡口中的前一个卡口为行停点并选定该卡口作为子轨迹的分割点。优选地,所述时间阈值M≥30min。优选地,所述步骤8)中的子轨迹相似度阈值ε≥0.4。本专利技术提供的技术方案至少具有如下有益效果:1、本专利技术将时间影响因素引入计算过程,从时间和空间上对轨迹相似度进行约束,提高了计算结果的精度和有效性,也扩大了该方法的适用范围。2、本专利技术提出了多轨迹相似度的计算方法,可用于对长度较大的轨迹进行相似度计算,相比于现有的单一轨迹对比法,本专利技术通过分割子轨迹和设置阈值形成合适的子轨迹集合,将不同集合中的子轨迹逐一进行对比得到多个相似度结果,然后将相似度结果代入多轨迹计算方法中得到两车间完整轨迹的相似度数据,计算方法经过优化、计算结果更为精准可靠,可以以此作为此判断两车间行为相似度的依据。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:图1是本专利技术所述计算方法的流程图;图2是本专利技术优选实施例1中A车在地图上的行驶轨迹;图3是本专利技术优选实施例1中B车在地图上的行驶轨迹。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域本文档来自技高网
...

【技术保护点】
1.一种基于卡口数据的车辆行为相似度计算方法,其特征在于,包括如下步骤:步骤1):通过设置在各个卡口的数据采集装置获得移动对象通过卡口时的数据信息,对上述数据信息进行整合保存以形成数据库;步骤2):根据A车辆的HPHM信息对数据库进行查询,得到若干个关于A车辆的卡口数据信息即轨迹点,将这些轨迹点按照时间顺序进行排序得到A车辆的原始轨迹;步骤3):对A车辆的原始轨迹进行清洗,对于在一定时间T内连续出现的相同卡口数据,过滤掉多余的重复数据;步骤4):将清洗后的轨迹分割成多段子轨迹,形成关于A车辆的n段子轨迹的集合;步骤5):针对B车辆重复上述步骤2)、步骤3)和步骤4),形成关于B车辆的m段子轨迹的集合;步骤6):对A、B车辆进行轨迹相似度计算,首先在两个集合中各取一条子轨迹,即TRA={<pa1,ta1>,<pa2,ta2>,...,<pan,tan>}  (1)TRB={<pb1,tb1>,<pb2,tb2>,...,<pbm,tbm>}  (2)其中,p代表车辆经过的某个卡口,t代表车辆通过p卡口的相应时刻且有tn‑1<tn以及tm‑1<tm,根据LCSS算法得到上述两个子轨迹间的最长公共子序列,即LC(TRA,TRB)={<pi,ti>,<pj,tj>,...,<pk,tk>}  (3)然后计算分别得到A、B车辆经过最长公共子序列中相邻两卡口所需时间的集合,即ΔTA={<taj‑tai>,...,<tak‑taj>}  (4)ΔTB={<tbj‑tbi>,...,<tbk‑tbj>}  (5)其中,Δt=ti‑tj(1<i,j<n,j<m,i<j),进而再分别得到A、B车辆经过最长公共子序列中相同相邻卡口所需时间差值的绝对值的集合,即ΔC={|Δtb1‑Δta1|,|Δtb2‑Δta2|,...|Δtbk‑Δtak|}  (6)ΔC={Δc1,Δc2,...,Δcn}计算时间影响因子,即...

【技术特征摘要】
1.一种基于卡口数据的车辆行为相似度计算方法,其特征在于,包括如下步骤:步骤1):通过设置在各个卡口的数据采集装置获得移动对象通过卡口时的数据信息,对上述数据信息进行整合保存以形成数据库;步骤2):根据A车辆的HPHM信息对数据库进行查询,得到若干个关于A车辆的卡口数据信息即轨迹点,将这些轨迹点按照时间顺序进行排序得到A车辆的原始轨迹;步骤3):对A车辆的原始轨迹进行清洗,对于在一定时间T内连续出现的相同卡口数据,过滤掉多余的重复数据;步骤4):将清洗后的轨迹分割成多段子轨迹,形成关于A车辆的n段子轨迹的集合;步骤5):针对B车辆重复上述步骤2)、步骤3)和步骤4),形成关于B车辆的m段子轨迹的集合;步骤6):对A、B车辆进行轨迹相似度计算,首先在两个集合中各取一条子轨迹,即TRA={<pa1,ta1>,<pa2,ta2>,...,<pan,tan>}(1)TRB={<pb1,tb1>,<pb2,tb2>,...,<pbm,tbm>}(2)其中,p代表车辆经过的某个卡口,t代表车辆通过p卡口的相应时刻且有tn-1<tn以及tm-1<tm,根据LCSS算法得到上述两个子轨迹间的最长公共子序列,即LC(TRA,TRB)={<pi,ti>,<pj,tj>,...,<pk,tk>}(3)然后计算分别得到A、B车辆经过最长公共子序列中相邻两卡口所需时间的集合,即ΔTA={<taj-tai>,...,<tak-taj>}(4)ΔTB={<tbj-tbi>,...,<tbk-tbj>}(5)其中,Δt=ti-tj(1<i,j<n,j<m,i<j),进而再分别得到A、B车辆经过最长公共子序列中相同相邻卡口所需时间差值的绝对值的集合,即ΔC={|Δtb1-Δta1|,|Δtb2-Δta2|,...|Δtbk-Δtak|}(6)ΔC={Δc1,Δc2,...,Δcn}计算时间影响因子,即根据上述公式计算两条子轨迹间...

【专利技术属性】
技术研发人员:张祖平赵婧龙哲
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1