一种查找同行车辆的实现方法、装置、设备及存储介质制造方法及图纸

技术编号:38660894 阅读:25 留言:0更新日期:2023-09-02 22:44
本发明专利技术提供一种查找同行车辆的实现方法、装置、设备及存储介质,方法包括获取卡口轨迹数据库存储的各车辆的过车轨迹数据,将每辆车每天的过车轨迹数据处理成一行完整轨迹序列数据;对每一行完整轨迹序列数据进行预处理;将生成的样本数据输入到神经网络模型中训练,获得轨迹模型;将卡口轨迹数据库存储的各车辆的过车轨迹数据输入至轨迹模型,将输出的轨迹特征向量存储至向量数据库;将待查询的车辆的过车轨迹数据输入至轨迹模型,根据输出的待查询的轨迹特征向量从向量数据库中查找出同行车辆。本发明专利技术的优点:泛化能力好,查询效率高,能够有效避免垃圾数据带来的不良影响,且轨迹模型的准确率高,可以保证同行车辆查找的准确率。率。率。

【技术实现步骤摘要】
一种查找同行车辆的实现方法、装置、设备及存储介质


[0001]本专利技术涉及数据处理
,特别涉及一种查找同行车辆的实现方法、装置、设备及存储介质。

技术介绍

[0002]随着信息化的发展和城市安全的建设,路面的卡口设备越来越多,卡口抓拍识别率越来越高,每个车辆的出行轨迹被记录的越来越精确。通过分析车辆轨迹在时空上的相似性,可以挖掘出两个目标车辆可能存在的一些时空关系或者是一些车辆潜在的联系。因每个城市每天都会形成大量的卡口过车轨迹数据,如何从这些数据中挖掘出有价值的数据和数据特征是目前亟需解决的一个难题。
[0003]目前,每天经过卡口产生的过车轨迹数据都会被存入至MPP数据库或者hive等数据仓库中。为了从过车轨迹数据中查找到同行车辆,常采用以下两种做法:第一种是直接采用sql的方式,通过sql查找出某两个车辆经过同一个卡口,两个车辆的过车时间相差1分钟(具体时间可根据需要进行修改),且在同一天的过车轨迹中至少存在5个(具体个数可根据需要调整)以上的卡口重合,这样才算同行车辆,然而这种做法的查询效率低下、体验不佳、且容易被垃圾数据影响(如某个卡口每次都会重复抓拍某些车辆);第二种是通过离线分析最近一个月的过车轨迹数据,事先将过车轨迹存在相似的两个车辆在一个月内具有3天(可调整)以上,且每天都存在估计交集的两个车牌分成同一个组,代表他们存在某种时空上面的关联,这种做法由于进行事先计算,因此对前端展示比较友好,但对于一些新的车辆过车轨迹泛化能力差,而且也会受到垃圾数据影响。
[0004]鉴于现有同行车辆查找存在效率低,容易被垃圾数据影响的缺陷,亟需提供一种能够提高查询效率、能够避免被垃圾数据影响,并能够保证准确率的实现方法。

技术实现思路

[0005]本专利技术要解决的技术问题,在于提供一种查找同行车辆的实现方法、装置、设备及存储介质,解决现有同行车辆查找存在效率低,容易被垃圾数据影响的问题。
[0006]第一方面,本专利技术提供了一种查找同行车辆的实现方法,所述方法包括如下步骤:
[0007]获取卡口轨迹数据库中存储的各车辆的过车轨迹数据,将每辆车每天的过车轨迹数据处理成一行完整轨迹序列数据;
[0008]对每一行完整轨迹序列数据进行预处理,为每一行完整轨迹序列数据查找出轨迹相似度较高的数据作为postive样本以及轨迹相似度较低的数据作为negative样本;
[0009]数据预处理完成后,将生成的样本数据输入到神经网络模型中进行样本训练,从而获得轨迹模型;
[0010]将卡口轨迹数据库中存储的各车辆的过车轨迹数据输入至轨迹模型,通过轨迹模型输出轨迹特征向量,并将轨迹特征向量存储至向量数据库中;
[0011]将待查询的车辆的过车轨迹数据输入至轨迹模型,通过轨迹模型输出待查询的轨
迹特征向量,根据待查询的轨迹特征向量从向量数据库中查找出同行车辆。
[0012]进一步的,所述的将每辆车每天的过车轨迹数据处理成一行完整轨迹序列数据包括:
[0013]判断每辆车在同一天内是否包含至少N个卡口的过车轨迹数据,如果是,则保留该辆车在该天的过车轨迹数据;如果否,则删除该辆车在该天的过车轨迹数据;其中,所述N为正整数;
[0014]对每天均创建一个第一txt文本,通过sql语句将每辆车每天的过车轨迹数据处理成一行完整轨迹序列数据,并将完整轨迹序列数据输入到当天的第一txt文本中。
[0015]进一步的,所述完整轨迹序列数据包括ID和轨迹点序列,所述ID与轨迹点序列之间通过第一分割符进行分割;
[0016]所述ID至少包括车牌号码;所述轨迹点序列包括多个轨迹点,各个所述轨迹点之间按照时间先后顺序进行排序,且相邻两个所述轨迹点之间通过第二分割符进行分割;
[0017]每个所述轨迹点均包括时间、经度和纬度三个元素,且相邻两个元素之间通过第三分割符进行分割。
[0018]进一步的,所述的对每一行完整轨迹序列数据进行预处理,为每一行完整轨迹序列数据查找出轨迹相似度较高的数据作为postive样本以及轨迹相似度较低的数据作为negative样本具体包括:
[0019]创建pass_list数组和neg_list数组,同时创建用于存储基准数据的第二txt文本、用于存储正样本数据的第三txt文本和用于存储负样本数据的第四txt文本;
[0020]循环获取第一txt文本中的每一行完整轨迹序列数据,且每获取出一行完整轨迹序列数据,均将获取的完整轨迹序列数据与第一txt文本中其它完整轨迹序列数据进行逐一比对计算轨迹相似分数,如果计算出的轨迹相似分数大于等于第一预设值,则将该其它完整轨迹序列数据存放到pass_list数组中,同时判断pass_list数组中存放的数据是否超过M1条,如果是,则将轨迹相似分数最小的数据删除;如果否,则不进行删除处理,从而找出与获取的完整轨迹序列数据的轨迹相似分数大于等于第一预设值的前M1条数据存放到pass_list数组中;
[0021]如果计算出的轨迹相似分数小于等于第二预设值,则判断neg_list数组中存放的数据是否等于M2条,如果是,则不再将该其它完整轨迹序列数据存放到neg_list数组中;如果否,则将该其它完整轨迹序列数据存放到neg_list数组中,并将该其它完整轨迹序列数据记录到第四txt文本中,从而找出与获取的完整轨迹序列数据的轨迹相似分数小于等于第二预设值的M2条数据存放到neg_list数组中;其中,所述M1与M2相等,且M1和M2均为正整数;
[0022]对于获取的每一行完整轨迹序列数据,在将该完整轨迹序列数据与第一txt文本中其它完整轨迹序列数据逐一比对完成后,判断pass_list数组的长度是否等于M1以及neg_list数组的长度是否等于M2,如果是,则将获取的该完整轨迹序列数据记录到第二txt文本中,同时将pass_list数组中的数据记录到第三txt文本中;如果否,则删除第四txt文本中记录的数据;
[0023]其中,在所述第二txt文本、第三txt文本和第四txt文本中,将数据中的时间转换为秒,将数据中的经纬度转换为墨卡托投影坐标。
[0024]进一步的,所述的将获取的完整轨迹序列数据与第一txt文本中其它的完整轨迹序列数据进行逐一比对计算轨迹相似分数具体为:
[0025]将需要进行比对的两个完整轨迹序列数据中的时间均处理成只含有时分秒属性的t1和t2,时间数组为value[t1,t2];将经度和纬度作为key,一个key代表一个轨迹点;
[0026]通过以下公式计算出轨迹相似分数xsfs:
[0027]xsfs=(dwchs/dwzs+xlchs/xlzs)/2
[0028]其中,dwzs为两个完整轨迹序列数据中的点位总数;dwchs为两个完整轨迹序列数据中的点位重合数;xlzs为两个完整轨迹序列数据中的总序列数;xlchs为两个完整轨迹序列数据中的序列重合数。
[0029]进一步的,所述的将生本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种查找同行车辆的实现方法,其特征在于:所述方法包括如下步骤:获取卡口轨迹数据库中存储的各车辆的过车轨迹数据,将每辆车每天的过车轨迹数据处理成一行完整轨迹序列数据;对每一行完整轨迹序列数据进行预处理,为每一行完整轨迹序列数据查找出轨迹相似度较高的数据作为postive样本以及轨迹相似度较低的数据作为negative样本;数据预处理完成后,将生成的样本数据输入到神经网络模型中进行样本训练,从而获得轨迹模型;将卡口轨迹数据库中存储的各车辆的过车轨迹数据输入至轨迹模型,通过轨迹模型输出轨迹特征向量,并将轨迹特征向量存储至向量数据库中;将待查询的车辆的过车轨迹数据输入至轨迹模型,通过轨迹模型输出待查询的轨迹特征向量,根据待查询的轨迹特征向量从向量数据库中查找出同行车辆。2.根据权利要求1所述一种查找同行车辆的实现方法,其特征在于:所述的将每辆车每天的过车轨迹数据处理成一行完整轨迹序列数据包括:判断每辆车在同一天内是否包含至少N个卡口的过车轨迹数据,如果是,则保留该辆车在该天的过车轨迹数据;如果否,则删除该辆车在该天的过车轨迹数据;其中,所述N为正整数;对每天均创建一个第一txt文本,通过sql语句将每辆车每天的过车轨迹数据处理成一行完整轨迹序列数据,并将完整轨迹序列数据输入到当天的第一txt文本中。3.根据权利要求1所述一种查找同行车辆的实现方法,其特征在于:所述完整轨迹序列数据包括ID和轨迹点序列,所述ID与轨迹点序列之间通过第一分割符进行分割;所述ID至少包括车牌号码;所述轨迹点序列包括多个轨迹点,各个所述轨迹点之间按照时间先后顺序进行排序,且相邻两个所述轨迹点之间通过第二分割符进行分割;每个所述轨迹点均包括时间、经度和纬度三个元素,且相邻两个元素之间通过第三分割符进行分割。4.根据权利要求2所述一种查找同行车辆的实现方法,其特征在于:所述的对每一行完整轨迹序列数据进行预处理,为每一行完整轨迹序列数据查找出轨迹相似度较高的数据作为postive样本以及轨迹相似度较低的数据作为negative样本具体包括:创建pass_list数组和neg_list数组,同时创建用于存储基准数据的第二txt文本、用于存储正样本数据的第三txt文本和用于存储负样本数据的第四txt文本;循环获取第一txt文本中的每一行完整轨迹序列数据,且每获取出一行完整轨迹序列数据,均将获取的完整轨迹序列数据与第一txt文本中其它完整轨迹序列数据进行逐一比对计算轨迹相似分数,如果计算出的轨迹相似分数大于等于第一预设值,则将该其它完整轨迹序列数据存放到pass_list数组中,同时判断pass_list数组中存放的数据是否超过M1条,如果是,则将轨迹相似分数最小的数据删除;如果否,则不进行删除处理,从而找出与获取的完整轨迹序列数据的轨迹相似分数大于等于第一预设值的前M1条数据存放到pass_list数组中;如果计算出的轨迹相似分数小于等于第二预设值,则判断neg_list数组中存放的数据是否等于M2条,如果是,则不再将该其它完整轨迹序列数据存放到neg_list数组中;如果否,则将该其它完整轨迹序列数据存放到neg_list数组中,并将该其它完整轨迹序列数据
记录到第四txt文本中,从而找出与获取的完整轨迹序列数据的轨迹相似分数小于等于第二预设值的M2条数据存放到neg_list数组中;其中,所述M1与M2相等,且M1和M2均为正整数;对于获取的每一行完整轨迹序列数据,在将该完整轨迹序列数据与第一txt文本中其它完整轨迹序列数据逐一比对完成后,判断pass_list数组的长度是否等于M1以及neg_list数组的长度是否等于M2,如果是,则将获取的该完整轨迹序列数据记录到第二txt文本中,同时将pass_list数组中的数据记录到第三txt文本中;如果否,则删除第四txt文本中记录的数据;其中,...

【专利技术属性】
技术研发人员:吴志雄徐春梅林雪红
申请(专利权)人:南威软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1