【技术实现步骤摘要】
一种车辆轨迹的相似度计算方法、系统及存储介质
本专利技术涉及数据挖掘分析
,尤其涉及一种车辆轨迹的相似度计算方法、系统及存储介质。
技术介绍
城市交通中,每天产生数以万计的车辆通行记录,而交通系统的车流数据是所有政务系统数据中数量最大、增长最快、蕴含信息最丰富的一种被重点关注的数据。交管情报部门通过每天分析这些数据,对交通流导向、交通管制措施、交通稽查等提供数据支持,并希望可以进行更加深度的挖掘和分析,从中发现车辆行车的路径选择倾向、车辆出行目的、车辆停车区域、以及出行的时间规律等。交通中的车辆轨迹数据的多样性和复杂性与日俱增,对车辆轨迹数据的挖掘和分析日趋重要。对交通中的车辆轨迹数据进行分析,不仅有助于交通物流、应急疏散管理、市场营销、模拟仿真和公安犯罪预测等多种领域的研究,还可以找出车辆热门路段或拥堵路段,并根据轨迹特征,判断车辆行驶是否存在异常情况。因为车辆轨迹中的轨迹点在时间维度上分布不均匀,并且不同车辆的轨迹时间跨度不一样。目前,传统的轨迹相似性研究仅仅考虑到对象的轨迹坐标,而忽略了时间维度, ...
【技术保护点】
1.一种车辆轨迹的相似度计算方法,其特征在于,包括以下步骤:/n获取车辆的历史运行数据作为原始数据,根据所述原始数据得到车辆轨迹集;/n根据所述车辆轨迹集中的各车辆轨迹得到字符串,其中,将车辆轨迹中的轨迹点视为字符串中的字符;/n采用最小编辑距离方法判断任意两个字符串之间是否需要执行编辑操作,在需要进行编辑操作的情况下,计算编辑位置的连续轨迹编辑长度;/n根据所述连续轨迹编辑长度计算编辑位置的编辑代价;/n根据所述编辑位置的编辑代价计算总编辑代价,并根据所述总编辑代价得到所述两个字符串对应的车辆轨迹之间的相似度。/n
【技术特征摘要】
1.一种车辆轨迹的相似度计算方法,其特征在于,包括以下步骤:
获取车辆的历史运行数据作为原始数据,根据所述原始数据得到车辆轨迹集;
根据所述车辆轨迹集中的各车辆轨迹得到字符串,其中,将车辆轨迹中的轨迹点视为字符串中的字符;
采用最小编辑距离方法判断任意两个字符串之间是否需要执行编辑操作,在需要进行编辑操作的情况下,计算编辑位置的连续轨迹编辑长度;
根据所述连续轨迹编辑长度计算编辑位置的编辑代价;
根据所述编辑位置的编辑代价计算总编辑代价,并根据所述总编辑代价得到所述两个字符串对应的车辆轨迹之间的相似度。
2.根据权利要求1所述的车辆轨迹的相似度计算方法,其特征在于,还包括以下步骤:
选取相似度超过相似度阈值的轨迹得到相似轨迹集,根据所述相似轨迹集挖掘热点路径。
3.根据权利要求1所述的车辆轨迹的相似度计算方法,其特征在于,所述根据所述原始数据得到车辆轨迹集之后还包括步骤:
并对所述原始数据进行分割形成至少三种不同语义的车辆轨迹集,分别为车辆行停轨迹集、车辆类别轨迹集和车辆时隙轨迹集;
在所述车辆行停轨迹集、所述车辆类别轨迹集和所述车辆时隙轨迹集三种语义方面分别计算各语义下的车辆轨迹的相似度,得到所述三种语义下的各车辆的所述轨迹相似度。
4.根据权利要求1所述的车辆轨迹的相似度计算方法,其特征在于,所述编辑操作包括增加、删除或者修改中的任意一种或者几种的组合。
5.根据权利要求1所述的车辆轨迹的相似度计算方法,其特征在于,所述车辆轨迹包括车辆的卡口编号,一个所述卡口编号表示一个所述轨迹点,所述卡口编号包括断面代码和方向编号。
6.根据权利要求1所述的车辆轨迹的相似度计算方法,其特征在于,所述采用最小编辑距离方法判断任意两个字符串之间是否需要执行编辑操作,在需要进行编辑操作的情况下,计算编辑位置的连续轨迹编辑长度包括:
选定任意两条车辆轨迹,分别视为第一字符串和第二字符串;
在所述第一字符串与第二字符串不一致的情况下,根据最小编辑距离方法执行编辑操作,并计算编辑位置的连续轨迹编辑长度,其中,所述连续轨迹编辑长度的动...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。