基于轨迹相似度的身份关联方法、装置、设备及存储介质制造方法及图纸

技术编号:25598908 阅读:18 留言:0更新日期:2020-09-11 23:56
本发明专利技术公开了一种基于轨迹相似度的身份关联方法、装置、设备及存储介质,该方法包括:将获取到的每个系统的待分析轨迹数据进行序列化,得到每个系统中的每个轨迹序列;计算每个系统中的每个轨迹序列与其他系统中的每个轨迹序列之间的细节相似度和整体相似度;对于每个系统中的每个轨迹序列,根据其与其他系统中的每个轨迹序列之间的细节相似度和整体相似度进行加权计算,得到其与其他系统中的每个轨迹序列之间的加权轨迹相似度;根据每个系统中的每个轨迹序列与其他系统中的每个轨迹序列之间的加权轨迹相似度,将不同系统间互为相似的轨迹序列的用户身份信息进行关联。采用本发明专利技术能够准确地将不同系统间互为相似的轨迹对应的身份信息进行关联。

【技术实现步骤摘要】
基于轨迹相似度的身份关联方法、装置、设备及存储介质
本专利技术涉及数据挖掘
,尤其涉及一种基于轨迹相似度的身份关联方法、装置、设备及存储介质。
技术介绍
随着技术的发展,现在人们活动的信息被各种各样的系统记录下来,如手机运营商记录下的用户轨迹、手机APP记录的用户移动轨迹、车载导航记录下的车辆移动轨迹、银行记录下的银行卡刷卡信息、宾馆记录下住户的住宿信息等等。这些信息所记录的身份ID各不相同,比方说手机运营商记录的身份ID是手机号,手机APP记录的是APP开户ID,车载导航记录的身份ID是导航仪的机器代码,银行记录的身份ID是银行卡号,宾馆记录的身份ID是身份证号。这些不同的身份ID都可能指向同一个物理对象,将同一个物理对象的不同身份ID关联起来,对全面分析同一个物理对象具有重要的意义,比如在侦案过程中将嫌疑人的全部信息关联进来可以更好的找到线索,侦破案件稳定社会。目前,一般是通过DTW(DynamicTimeWarping,动态时间归整)算法,计算目标轨迹与所有待比对轨迹的相似度,再将相似度高的轨迹对应的身份信息与目标轨迹的身份信息进行关联。然而,专利技术人在实施本专利技术的过程中发现,由于DTW算法本身更适合于轨迹之间整体趋势比较的特性,现有的身份关联方法仅基于目标轨迹与所有待比对轨迹之间的整体特征的相似程度进行身份关联,而忽略了轨迹之间的细节特征的相似程度,影响身份关联的准确率。
技术实现思路
本专利技术实施例提供一种基于轨迹相似度的身份关联方法、装置、设备及存储介质,能够准确地将不同系统间互为相似的轨迹对应的身份信息进行关联。为了实现上述目的,本专利技术一实施例提供一种基于轨迹相似度的身份关联方法,包括:获取每个系统的待分析轨迹数据;基于所述每个系统中的各用户身份信息,按照时间顺序排序,对所述每个系统的待分析轨迹数据进行序列化处理,得到所述每个系统中的每个轨迹序列;对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的细节相似度;对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的整体相似度;对于所述每个系统中的每个轨迹序列,根据其与其他系统中的每个轨迹序列之间的细节相似度、整体相似度、细节相似度权重和整体相似度权重进行加权计算,得到其与其他系统中的每个轨迹序列之间的加权轨迹相似度;根据所述每个系统中的每个轨迹序列与其他系统中的每个轨迹序列之间的加权轨迹相似度,将不同系统间互为相似的轨迹序列的用户身份信息进行关联。作为上述方案的改进,通过以下方式计算两个轨迹序列之间的细节相似度:检测两个轨迹序列的轨迹长度,并将所述两个轨迹序列中轨迹长度较短的轨迹序列设为第一轨迹序列,轨迹长度较长的轨迹序列设为第二轨迹序列;通过判断所述第一轨迹序列中的每一轨迹点是否为所述第二轨迹序列的细节相似点,得到所述两个轨迹序列对应的细节相似点序列;根据所述第一轨迹序列中的轨迹点个数和所述细节相似点序列中的细节相似点个数进行计算,得到所述第一轨迹序列和所述第二轨迹序列之间的细节相似度。作为上述方案的改进,通过以下方式判断所述第一轨迹序列中的某个轨迹点是否为所述第二轨迹序列的细节相似点:将所述第一轨迹序列中的该轨迹点作为待分析轨迹点,判断所述第二轨迹序列中是否存在与所述待分析轨迹点的时间戳之差的绝对值小于或等于预设时间阈值,且与所述待分析轨迹点之间的地点距离小于或等于预设距离阈值的第一轨迹点;若是,则确定所述待分析轨迹点为所述第二轨迹序列的细节相似点;若否,则执行下一步骤;从所述第二轨迹序列中的第一区间中选取时间戳最大的轨迹点作为第二轨迹点,从所述第二轨迹序列中的第二区间中选取时间戳最小的轨迹点作为第三轨迹点;其中,所述第一区间内的轨迹点的时间戳均小于或等于所述待分析轨迹点的时间戳,所述第二区间内的轨迹点的时间戳均大于或等于所述待分析轨迹点的时间戳;分别将所述第二轨迹点和所述第三轨迹点中,与所述待分析轨迹点之间的地点距离较小和较大的点,设为距离较小点和距离较大点;按照时间戳先后顺序,将所述距离较小点和所述待分析轨迹点连接为第一向量,并将所述距离较小点和距离较大点连接为第二向量;判断所述第一向量与所述第二向量之间的夹角是否大于或等于第一预设夹角阈值且小于或等于第二预设夹角阈值;若是,则进入下一步骤;若否,则判定所述待分析轨迹点不是所述第二轨迹序列的细节相似点;判断所述待分析轨迹点到所述第二向量的垂直距离是否小于或等于预设垂直距离阈值;若是,则判定所述待分析轨迹点是所述第二轨迹序列的细节相似点;若否,则判定所述待分析轨迹点不是所述第二轨迹序列的细节相似点。作为上述方案的改进,在所述对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的细节相似度之后,还包括步骤:对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的细节相似度权重和整体相似度权重;其中,所述整体相似度权重等于1与所述细节相似度权重之差;其中,通过以下方式计算两个轨迹序列之间的细节相似度权重:获取两个轨迹序列对应的细节相似点序列中的最大时间戳和最小时间戳;获取所述两个轨迹序列中的最大时间戳和最小时间戳;计算所述两个轨迹序列对应的细节相似点序列中的最大时间戳和最小时间戳之差与所述两个轨迹序列中的最大时间戳和最小时间戳之差的比值,并将计算得到的比值作为两个轨迹序列之间的细节相似度权重。作为上述方案的改进,所述对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的整体相似度,具体包括:对于所述每个系统中的每个轨迹序列,对其进行轨迹压缩,得到其对应的压缩轨迹序列;对于所述每个系统中的每个轨迹序列,根据其对应的压缩轨迹序列和其他系统中的每个轨迹序列对应的压缩轨迹序列进行整体相似度计算,并将计算结果作为其与其他系统中的每个轨迹序列之间的整体相似度。作为上述方案的改进,所述对于所述每个系统中的每个轨迹序列,根据其对应的压缩轨迹序列和其他系统中的每个轨迹序列对应的压缩轨迹序列进行整体相似度计算,并将计算结果作为其与其他系统中的每个轨迹序列之间的整体相似度,具体为:对于所述每个系统中的每个轨迹序列,通过动态时间规整算法,计算其对应的压缩轨迹序列与其他系统中的每个轨迹序列对应的压缩轨迹序列之间的DTW相似度,并将计算结果作为其与其他系统中的每个轨迹序列之间的整体相似度。作为上述方案的改进,所述根据所述每个系统中的每个轨迹序列与其他系统中的每个轨迹序列之间的加权轨迹相似度,将不同系统间互为相似的轨迹序列的用户身份信息进行关联,具体包括:对于所述每个系统中的每个轨迹序列,根据其与其他系统中的每个轨迹序列之间的加权轨迹相似度,判断每个其他系统中是否存在与其相似的轨迹序列,并将判定为与其相似的轨迹序列作为其对应的相似轨迹序列;根据所述每个系统中的每个轨迹序列对应的相似轨迹序列,本文档来自技高网...

【技术保护点】
1.一种基于轨迹相似度的身份关联方法,其特征在于,包括:/n获取每个系统的待分析轨迹数据;/n基于所述每个系统中的各用户身份信息,按照时间顺序排序,对所述每个系统的待分析轨迹数据进行序列化处理,得到所述每个系统中的每个轨迹序列;/n对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的细节相似度;/n对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的整体相似度;/n对于所述每个系统中的每个轨迹序列,根据其与其他系统中的每个轨迹序列之间的细节相似度、整体相似度、细节相似度权重和整体相似度权重进行加权计算,得到其与其他系统中的每个轨迹序列之间的加权轨迹相似度;/n根据所述每个系统中的每个轨迹序列与其他系统中的每个轨迹序列之间的加权轨迹相似度,将不同系统间互为相似的轨迹序列的用户身份信息进行关联。/n

【技术特征摘要】
1.一种基于轨迹相似度的身份关联方法,其特征在于,包括:
获取每个系统的待分析轨迹数据;
基于所述每个系统中的各用户身份信息,按照时间顺序排序,对所述每个系统的待分析轨迹数据进行序列化处理,得到所述每个系统中的每个轨迹序列;
对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的细节相似度;
对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的整体相似度;
对于所述每个系统中的每个轨迹序列,根据其与其他系统中的每个轨迹序列之间的细节相似度、整体相似度、细节相似度权重和整体相似度权重进行加权计算,得到其与其他系统中的每个轨迹序列之间的加权轨迹相似度;
根据所述每个系统中的每个轨迹序列与其他系统中的每个轨迹序列之间的加权轨迹相似度,将不同系统间互为相似的轨迹序列的用户身份信息进行关联。


2.如权利要求1所述的基于轨迹相似度的身份关联方法,其特征在于,通过以下方式计算两个轨迹序列之间的细节相似度:
检测两个轨迹序列的轨迹长度,并将所述两个轨迹序列中轨迹长度较短的轨迹序列设为第一轨迹序列,轨迹长度较长的轨迹序列设为第二轨迹序列;
通过判断所述第一轨迹序列中的每一轨迹点是否为所述第二轨迹序列的细节相似点,得到所述两个轨迹序列对应的细节相似点序列;
根据所述第一轨迹序列中的轨迹点个数和所述细节相似点序列中的细节相似点个数进行计算,得到所述第一轨迹序列和所述第二轨迹序列之间的细节相似度。


3.如权利要求2所述的基于轨迹相似度的身份关联方法,其特征在于,通过以下方式判断所述第一轨迹序列中的某个轨迹点是否为所述第二轨迹序列的细节相似点:
将所述第一轨迹序列中的该轨迹点作为待分析轨迹点,判断所述第二轨迹序列中是否存在与所述待分析轨迹点的时间戳之差的绝对值小于或等于预设时间阈值,且与所述待分析轨迹点之间的地点距离小于或等于预设距离阈值的第一轨迹点;若是,则确定所述待分析轨迹点为所述第二轨迹序列的细节相似点;若否,则执行下一步骤;
从所述第二轨迹序列中的第一区间中选取时间戳最大的轨迹点作为第二轨迹点,从所述第二轨迹序列中的第二区间中选取时间戳最小的轨迹点作为第三轨迹点;其中,所述第一区间内的轨迹点的时间戳均小于或等于所述待分析轨迹点的时间戳,所述第二区间内的轨迹点的时间戳均大于或等于所述待分析轨迹点的时间戳;
分别将所述第二轨迹点和所述第三轨迹点中,与所述待分析轨迹点之间的地点距离较小和较大的点,设为距离较小点和距离较大点;
按照时间戳先后顺序,将所述距离较小点和所述待分析轨迹点连接为第一向量,并将所述距离较小点和距离较大点连接为第二向量;
判断所述第一向量与所述第二向量之间的夹角是否大于或等于第一预设夹角阈值且小于或等于第二预设夹角阈值;若是,则进入下一步骤;若否,则判定所述待分析轨迹点不是所述第二轨迹序列的细节相似点;
判断所述待分析轨迹点到所述第二向量的垂直距离是否小于或等于预设垂直距离阈值;若是,则判定所述待分析轨迹点是所述第二轨迹序列的细节相似点;若否,则判定所述待分析轨迹点不是所述第二轨迹序列的细节相似点。


4.如权利要求2所述的基于轨迹相似度的身份关联方法,其特征在于,在所述对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的细节相似度之后,还包括步骤:
对于所述每个系统中的每个轨迹序列,计算其与其他系统中的每个轨迹序列之间的细节相似度权重和整体相似度权重;其中,所述整体相似度权重等于1与所述细节相似度权重之差;
其中,通过以下方式计算两个轨迹序列之间的细节相似度权重:
获取两个轨迹序列对应的细节相似点序列中的最大时间戳和最小时间戳;
获取所述两个轨迹序列中的最大时间戳和最小时间戳;
计算所述两个轨迹序列对应的细节相似点序列中的最大时间戳和最小时间戳之差与所述两个轨迹序列中的最大时间戳和最小时间戳之差的比值,并将计算得...

【专利技术属性】
技术研发人员:冯和辉潘谷王科峰刘双广
申请(专利权)人:高新兴科技集团股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1