一种轨迹重合度检测方法、装置及电子设备制造方法及图纸

技术编号:39304369 阅读:11 留言:0更新日期:2023-11-12 15:53
本申请公开了一种轨迹重合度检测方法、装置及电子设备,涉及通信技术领域,以解决相关技术效率和准确率低的问题。该方法包括:获取原始轨迹数据集;按照第一压缩粒度对原始轨迹数据集进行压缩处理,得到第一粒度轨迹数据集;根据第一粒度轨迹数据集中每两条轨迹数据的相似度,确定候选轨迹数据集;获取按照第二压缩粒度对目标轨迹数据集进行压缩处理得到的第二粒度轨迹数据集,目标轨迹数据集包括原始轨迹数据集,或者包括原始轨迹数据集中与候选轨迹数据集对应的原始轨迹数据,第二压缩粒度小于第一压缩粒度;根据第二粒度轨迹数据集中每两条轨迹数据的相似度,确定相似轨迹数据集。本申请实施例能够提升用户轨迹重合度检测的效率和准确率。的效率和准确率。的效率和准确率。

【技术实现步骤摘要】
一种轨迹重合度检测方法、装置及电子设备


[0001]本申请涉及通信
,尤其涉及一种轨迹重合度检测方法、装置及电子设备。

技术介绍

[0002]随着移动位置信息数据的快速增长,从海量时空数据中提取有用信息变得十分重要。通过对大规模用户的移动轨迹进行分析可以得出用户间的行为相似性,并可依此对用户进行分类或相似性分析等处理,为精准营销和智能推荐提供指导。
[0003]目前对于基于时空数据的用户轨迹重合度识别存在难度。现有技术中,主要采用基于距离的用户轨迹重合度识别方法,即通过如最长公共子序列(Longest Common Subsequence,LCSS)、动态时间规整(Dynamic Time Warping,DTW)、编辑距离等方式来计算两条轨迹之间的距离。但是该方法存在如下问题:一方面,由于不同轨迹数据的采样率不一致、采样过程存在噪声等问题,导致难以直接进行轨迹匹配,进而造成结果误差;另一方面,易因用户数量多、轨迹数据点多导致计算量庞大和效率低下。可见,现有用户轨迹重合度识别方法存在效率和准确率较低的问题。

技术实现思路

[0004]本申请实施例提供一种轨迹重合度检测方法、装置及电子设备,以解决现有用户轨迹重合度识别方法效率和准确率较低的问题。
[0005]第一方面,本申请实施例提供了一种轨迹重合度检测方法,包括:
[0006]获取原始轨迹数据集;
[0007]按照第一压缩粒度分别对所述原始轨迹数据集中每条原始轨迹数据进行压缩处理,得到第一粒度轨迹数据集;
>[0008]根据所述第一粒度轨迹数据集中每两条轨迹数据的相似度和第一相似度阈值,确定候选轨迹数据集;
[0009]获取所述候选轨迹数据集对应的第二粒度轨迹数据集,其中,所述第二粒度轨迹数据集是按照第二压缩粒度对目标轨迹数据集进行压缩处理得到的,所述目标轨迹数据集包括所述原始轨迹数据集中的每条原始轨迹数据,或者包括所述原始轨迹数据集中与所述候选轨迹数据集中每条候选轨迹数据对应的每条原始轨迹数据,所述第二压缩粒度小于所述第一压缩粒度;
[0010]根据所述第二粒度轨迹数据集中每两条轨迹数据的相似度和第二相似度阈值,确定相似轨迹数据集。
[0011]可选地,所述原始轨迹数据集中的每条原始轨迹数据包括多个位置点和每个位置点对应的时间戳;
[0012]所述按照第一压缩粒度分别对所述原始轨迹数据集中每条原始轨迹数据进行压缩处理,得到第一粒度轨迹数据集,包括:
[0013]将第一原始轨迹数据中对应时间戳处于N个时间区间中同一时间区间的多个位置
点进行合并,得到所述第一原始轨迹数据对应的第一粒度轨迹数据,其中,所述第一原始轨迹数据为所述原始轨迹数据集中的任一原始轨迹数据,所述N个时间区间的时间单位为第一时间单位,N为大于1的整数;
[0014]所述获取所述候选轨迹数据集对应的第二粒度轨迹数据集,包括:
[0015]将第二原始轨迹数据中对应时间戳处于M个时间区间中同一时间区间的多个位置点进行合并,得到所述第二原始轨迹数据对应的第二粒度轨迹数据,其中,所述第二原始轨迹数据为所述目标轨迹数据集中任一原始轨迹数据,所述M个时间区间的时间单位为第二时间单位,所述第二时间单位小于所述第一时间单位,M为大于N的整数。
[0016]可选地,所述将第一原始轨迹数据中对应时间戳处于N个时间区间中同一时间区间的多个位置点进行合并,得到所述第一原始轨迹数据对应的第一粒度轨迹数据,包括:
[0017]确定所述第一原始轨迹数据中对应时间戳处于N个时间区间中同一时间区间的多个第一位置点;根据预先对地图进行栅格化得到的网格,确定所述多个第一位置点中每个第一位置点所处的网格;将所述每个第一位置点所处的网格进行合并,得到包括多个合并网格的第一粒度轨迹数据;
[0018]和/或,
[0019]所述将第二原始轨迹数据中对应时间戳处于M个时间区间中同一时间区间的多个位置点进行合并,得到所述第二原始轨迹数据对应的第二粒度轨迹数据,包括:
[0020]确定所述第二原始轨迹数据中对应时间戳处于M个时间区间中同一时间区间的多个第二位置点;根据预先对地图进行栅格化得到的网格,确定所述多个第二位置点中每个第二位置点所处的网格;将所述每个第二位置点所处的网格进行合并,得到包括多个合并网格的第二粒度轨迹数据。
[0021]可选地,所述根据所述第二粒度轨迹数据集中每两条轨迹数据的相似度和第二相似度阈值,确定相似轨迹数据集,包括:
[0022]将所述第二粒度轨迹数据集中的每两个第二粒度轨迹数据输入预先训练的第一孪生神经网络中进行相似度计算,得到所述第一孪生神经网络输出的所述每两个第二粒度轨迹数据的相似度,其中,所述第一孪生神经网络基于所述第二压缩粒度的轨迹数据样本集进行训练得到的;
[0023]在所述每两个第二粒度轨迹数据的相似度大于所述第二相似度阈值的情况下,确定所述每两个第二粒度轨迹数据为相似轨迹数据。
[0024]可选地,所述第一孪生神经网络包括长短期记忆网络(Long Short

Term Memory,LSTM)模型和周期性特征提取模块;
[0025]所述将所述第二粒度轨迹数据集中的每两个第二粒度轨迹数据输入预先训练的第一孪生神经网络中进行相似度计算,得到所述第一孪生神经网络输出的所述每两个第二粒度轨迹数据的相似度,包括:
[0026]通过所述LSTM模型将第一输入轨迹数据和第二输入轨迹数据分别映射成第一特征向量,其中,所述第一输入轨迹数据和所述第二输入轨迹数据为所述第二粒度轨迹数据集中的每两个第二粒度轨迹数据;
[0027]通过所述周期性特征提取模块按至少一种日期类型对所述第一输入轨迹数据和所述第二输入轨迹数据分别提取周期特征向量;
[0028]对所述第一输入轨迹数据的第一特征向量和周期特征向量进行融合,得到第一融合特征向量,以及对所述第二输入轨迹数据的第一特征向量和周期特征向量进行融合,得到第二融合特征向量;
[0029]计算所述第一融合特征向量与所述第二融合特征向量的相似度,得到所述第一输入轨迹数据与所述第二输入轨迹数据的相似度。
[0030]可选地,所述周期性特征提取模块包括第一特征提取子模块、第二特征提取子模块、第三特征提取子模块和特征融合模块;
[0031]所述通过所述周期性特征提取模块按至少一种日期类型对所述第一输入轨迹数据和所述第二输入轨迹数据分别提取周期特征向量,包括:
[0032]通过所述第一特征提取子模块按第一日期类型对所述第一输入轨迹数据和所述第二输入轨迹数据分别提取特征值,得到所述第一输入轨迹数据的第一周期特征向量和所述第二输入轨迹数据的第一周期特征向量,所述第一日期类型包括工作日和非工作日;
[0033]通过所述第二特征提取子模块按第二日期类型对所述第一输入轨迹数据和所述第二输入轨迹数据分别提取特征值,得到所述第一输入轨迹数据的第二周期特征向量和所述本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种轨迹重合度检测方法,其特征在于,包括:获取原始轨迹数据集;按照第一压缩粒度分别对所述原始轨迹数据集中每条原始轨迹数据进行压缩处理,得到第一粒度轨迹数据集;根据所述第一粒度轨迹数据集中每两条轨迹数据的相似度和第一相似度阈值,确定候选轨迹数据集;获取所述候选轨迹数据集对应的第二粒度轨迹数据集,其中,所述第二粒度轨迹数据集是按照第二压缩粒度对目标轨迹数据集进行压缩处理得到的,所述目标轨迹数据集包括所述原始轨迹数据集中的每条原始轨迹数据,或者包括所述原始轨迹数据集中与所述候选轨迹数据集中每条候选轨迹数据对应的每条原始轨迹数据,所述第二压缩粒度小于所述第一压缩粒度;根据所述第二粒度轨迹数据集中每两条轨迹数据的相似度和第二相似度阈值,确定相似轨迹数据集。2.根据权利要求1所述的方法,其特征在于,所述原始轨迹数据集中的每条原始轨迹数据包括多个位置点和每个位置点对应的时间戳;所述按照第一压缩粒度分别对所述原始轨迹数据集中每条原始轨迹数据进行压缩处理,得到第一粒度轨迹数据集,包括:将第一原始轨迹数据中对应时间戳处于N个时间区间中同一时间区间的多个位置点进行合并,得到所述第一原始轨迹数据对应的第一粒度轨迹数据,其中,所述第一原始轨迹数据为所述原始轨迹数据集中的任一原始轨迹数据,所述N个时间区间的时间单位为第一时间单位,N为大于1的整数;所述获取所述候选轨迹数据集对应的第二粒度轨迹数据集,包括:将第二原始轨迹数据中对应时间戳处于M个时间区间中同一时间区间的多个位置点进行合并,得到所述第二原始轨迹数据对应的第二粒度轨迹数据,其中,所述第二原始轨迹数据为所述目标轨迹数据集中任一原始轨迹数据,所述M个时间区间的时间单位为第二时间单位,所述第二时间单位小于所述第一时间单位,M为大于N的整数。3.根据权利要求2所述的方法,其特征在于,所述将第一原始轨迹数据中对应时间戳处于N个时间区间中同一时间区间的多个位置点进行合并,得到所述第一原始轨迹数据对应的第一粒度轨迹数据,包括:确定所述第一原始轨迹数据中对应时间戳处于N个时间区间中同一时间区间的多个第一位置点;根据预先对地图进行栅格化得到的网格,确定所述多个第一位置点中每个第一位置点所处的网格;将所述每个第一位置点所处的网格进行合并,得到包括多个合并网格的第一粒度轨迹数据;和/或,所述将第二原始轨迹数据中对应时间戳处于M个时间区间中同一时间区间的多个位置点进行合并,得到所述第二原始轨迹数据对应的第二粒度轨迹数据,包括:确定所述第二原始轨迹数据中对应时间戳处于M个时间区间中同一时间区间的多个第二位置点;根据预先对地图进行栅格化得到的网格,确定所述多个第二位置点中每个第二位置点所处的网格;将所述每个第二位置点所处的网格进行合并,得到包括多个合并网格
的第二粒度轨迹数据。4.根据权利要求1所述的方法,其特征在于,所述根据所述第二粒度轨迹数据集中每两条轨迹数据的相似度和第二相似度阈值,确定相似轨迹数据集,包括:将所述第二粒度轨迹数据集中的每两个第二粒度轨迹数据输入预先训练的第一孪生神经网络中进行相似度计算,得到所述第一孪生神经网络输出的所述每两个第二粒度轨迹数据的相似度,其中,所述第一孪生神经网络基于所述第二压缩粒度的轨迹数据样本集进行训练得到的;在所述每两个第二粒度轨迹数据的相似度大于所述第二相似度阈值的情况下,确定所述每两个第二粒度轨...

【专利技术属性】
技术研发人员:刘宁陈星宇郭叶程印超
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1