【技术实现步骤摘要】
一种ID时空轨迹匹配方法及装置
本专利技术涉及数据处理领域,具体而言,涉及一种ID时空轨迹匹配方法及装置。
技术介绍
随着各种信息采集技术的快速发展,在多个固定地点可以采集到周边的多种大规模ID数据,如车牌号、手机IMSI、手机MAC地址等。通过多地大量部署采集器,可以得到相同ID在多个采集器部署地点间的时空轨迹(定点轨迹)。轨迹数据是轨迹点的序列,轨迹点是ID在某一采集器旁出现的记录,它由采集器的编号和ID的出现时间戳组成,每个采集器对应一组经纬度坐标。通过衡量不同种类的ID的定点轨迹相似度,可以设定相似度阈值以判别多种ID是否属于同一人。这对于建立个人ID数据库有很大帮助。现有轨迹相似度衡量方法主要分为空间相似度(SpatialSimilaritV)衡量方法和时空相似度(Spatio-TemporalSimilarity)衡量方法。其中空间相似度衡量方法完全不考虑轨迹点出现的时序,因此无法被使用于匹配定点轨迹。时空相似度则考虑了轨迹点出现的时序。具有代表性的时空相似度衡量是动态时间规整(DynamicTimeWr ...
【技术保护点】
1.一种ID时空轨迹匹配方法,其特征在于,包括:/n通过布置在各地的采集器采集不同类型的第一ID数据和第二ID数据,其中,所述第一ID数据和第二ID数据的每条数据记录中包括数据类型、采集器位置编号和采集时间戳;/n将所述数据记录按相同采集地点和日期进行分组,以及将所述数据记录按相同数据类型分组,并转换为哈希表;/n在所述哈希表中遍历各地点日期组,对于同一地点日期组,如果第一ID数据和第二ID数据的两条数据记录采集时间区间相同或相邻,则将所述第一ID数据和所述第二ID数据保存为预选的ID配对;/n遍历各预选的ID配对,对于每个预选的ID配对,从所述哈希表中分别获取第一ID数据 ...
【技术特征摘要】
1.一种ID时空轨迹匹配方法,其特征在于,包括:
通过布置在各地的采集器采集不同类型的第一ID数据和第二ID数据,其中,所述第一ID数据和第二ID数据的每条数据记录中包括数据类型、采集器位置编号和采集时间戳;
将所述数据记录按相同采集地点和日期进行分组,以及将所述数据记录按相同数据类型分组,并转换为哈希表;
在所述哈希表中遍历各地点日期组,对于同一地点日期组,如果第一ID数据和第二ID数据的两条数据记录采集时间区间相同或相邻,则将所述第一ID数据和所述第二ID数据保存为预选的ID配对;
遍历各预选的ID配对,对于每个预选的ID配对,从所述哈希表中分别获取第一ID数据和第二ID数据对应的轨迹数据,并按时间顺序分别合并两组轨迹数据;
计算两组轨迹相似度,将轨迹相似度高于阈值的预选ID配对确定为匹配。
2.根据权利要求1所述的方法,其特征在于,遍历各预选的ID配对之前,还包括:
删除重复保存的所述预选的ID配对。
3.根据权利要求1所述的方法,其特征在于,从所述哈希表中分别获取第一ID数据和第二ID数据对应的轨迹数据之后,还包括:
判断所述两组轨迹的所有数据是否来源于同一个采集器,如果是,则不计算该两组轨迹的相似度。
4.根据权利要求1所述的方法,其特征在于,计算两组轨迹相似度之前,还包括:
遍历两组轨迹数据,将时间间隔短于μt,距离间隔短于μd的轨迹点合并,仅保留首个轨迹点,其中,μt为采集器的时间延迟误差范围,μd为该时间范围内行人可能触发的两个采集器的最大距离。
5.根据权利要求1所述的方法,其特征在于,计算两组轨迹相似度包括:
根据采集器经纬度信息,计算出每两个采集器位置间的大圆距离并储存为哈希表;
根据两点相似度函数计算两组轨迹相似度。
6.一种ID时空轨迹匹配装置,其特征在于,包括:
采集模块,用于通过布置在各地的采集器采集不同类型的第一ID数据和第二ID数据,其中,所述第一ID数据和第二ID数据的每条数据记录中包括数据类型、采集器位置编号和采集时间戳;<...
【专利技术属性】
技术研发人员:梁秀钦,周紫昊,林晓明,罗华刚,周广一,王俊威,李迪民,陈栋,齐云飞,
申请(专利权)人:北京明略软件系统有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。