【技术实现步骤摘要】
一种基于马尔科夫链的加权轨迹相似度匹配方法
[0001]本专利技术涉及一种基于马尔科夫链的加权轨迹相似度匹配方法。
技术介绍
[0002]近年来,随着移动通信技术以及互联网技术的发展,通过查询移动设备的唯一标示符,得到其某段时间内的轨迹数据。同时,在线社交网络中也包含某个用户的轨迹信息,例如,互联网的博文包含时间和位置信息。轨迹身份匹配就是将属于现实生活中同一个用户的移动设备和互联网社交账号进行匹配,从而实现多个在线社交网络的用户信息整合的一种技术,在商品推荐、兴趣点挖掘、用户信息关联以及网络安全领域有着十分重要的意义。
[0003]常用的算法为基于距离的相似度比较算法,主要有夹角余弦、欧式距离法、曼哈顿距离、切比雪夫距离、最小边界矩形距离法、最长公共子序列法以及编辑距离法等。但是这些相似度比较算法用于宽泛的比较序列的相似度。对于特殊的轨迹数据的应用这些匹配算法,会使数据的利用率不足。因而,在移动大数据的环境下,亟需提出一种基于轨迹相似度的匹配方法,以满足日常个体轨迹间相似度计算的需求。
[0004]公开号为 ...
【技术保护点】
【技术特征摘要】
1.一种基于马尔科夫链的加权轨迹相似度匹配方法,其特征在于:包括以下步骤:S1:获取待匹配用户U的原始移动信令数据和待匹配用户V的原始互联网信息平台数据,设置可以确定在原始移动信令数据的待匹配用户U和在原始互联网信息平台数据的待匹配用户V为同一用户的相似度阈值;具体包括如下步骤:S1.1:获取待匹配用户U的原始移动信令数据中的IMSI、StartTime、LocLng以及LocLat字段;S1.2:获取待匹配用户V的原始互联网信息平台数据中的date title和place title字段数据;S2:获取待匹配用户U的移动信令轨迹和待匹配用户V的互联网信息平台轨迹;具体包括如下步骤:S2.1:在移动信令数据中,根据待匹配用户U的IMSI查询StartTime、LocLng以及LocLat字段,按照轨迹点的即时时间StartTime排序,LocLng和LocLat定位地址,即得到待匹配用户U的移动信令轨迹;S2.2:将互联网信息平台数据中的date title和对应的place title配对,并且按date title的顺序排列,place title定位地址,即得到待匹配用户V的互联网信息平台轨迹;S3:处理待匹配用户U的移动信令轨迹和待匹配用户V的互联网信息平台轨迹,分别得到当前时刻对于上一时刻待匹配用户U的移动信令轨迹和待匹配用户V的互联网信息平台轨迹的三维特征信息,包括方位角、距离差和时间差;S4:分别将待匹配用户U的移动信令轨迹和待匹配用户V的互联网信息平台轨迹的各个三维特征信息计算余弦相似度,并将三个所得相似度值施加权重求得待匹配用户U和待匹配用户V的总相似度值Sim(U,V)=(degreeSim,distanceSim,intervalSim);S5:当Sim(U,V)大于步骤S1所述的相似度阈值,即可确定待匹配用户U和待匹配用户V为在移动信令数据和互联网信息平台数据上的同一用户。2.根据权利要求1所述的一种基于马尔科夫链的加权轨迹相似度匹配方法,其特征在于:所述步骤S3具体包括:使用插值法将移动信令轨迹做降维处理,使其和互联网信息平台轨迹的轨迹点对齐,即移动信令轨迹和互联网信息平台轨迹上的轨迹点个数相同;待匹配用户U的在每个移动信令轨迹点包含三个信息,分别是时间t、纬度lat和经度lng;使用这三个信息计算得到待匹配用户U的移动信令轨迹在时刻t
i+1
相对于时刻t
i
时的T(U)的三维特征信息,即方位角degree、距离差distance和时间差interval;此时,待匹配用户U在时间t内的轨迹记...
【专利技术属性】
技术研发人员:余琦琦,
申请(专利权)人:浙江商业职业技术学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。