基于移动轨迹数据的用户识别方法、装置及存储介质制造方法及图纸

技术编号:31018743 阅读:19 留言:0更新日期:2021-11-30 03:03
本申请提供了一种基于移动轨迹数据的用户识别方法、装置及存储介质,该方法包括:获取任意两条待判别的目标轨迹数据,其中,目标轨迹数据为从目标区域中提取出的路径信息,目标区域为用户访问过的区域;将目标轨迹数据的表征集合输入到目标模型内,判断目标轨迹数据是否来自同一用户,其中,目标模型是由初始判别模型训练得到的,输入初始判别模型的训练参数包括:任意两条初始轨迹数据之间的共现次数、任意两条初始轨迹数据之间的角度余弦值、任意两条初始轨迹数据之间的概率偏差值、任意两条初始轨迹数据之间的相似度数值以及用于指示任意两条初始轨迹数据是否来自同一用户的标注信息。通过本申请,解决了相关技术中存在的用户识别准确率较低,稳定性不高的问题。稳定性不高的问题。稳定性不高的问题。

【技术实现步骤摘要】
基于移动轨迹数据的用户识别方法、装置及存储介质


[0001]本申请涉及计算机领域,尤其涉及一种基于移动轨迹数据的用户识别方法、装置及存储介质。

技术介绍

[0002]轨迹数据是时空环境下,通过对移动对象运动过程的采样所获得的数据类型,包含经纬度、时间、海拔、速度等信息,这些采样点按照时间顺序构成了轨迹数据。随着科学与技术的发展,位置获取技术例如GPS和蜂窝通信网格定位越来越普及,更多的轨迹数据被收集并用于位置服务。基于轨迹数据的用户识别是轨迹数据挖掘中的重要研究方向之一,通过对移动轨迹间的相似性度量可以识别未知轨迹的真实用户信息,这在用户画像构建、社会安全防范等方面具有较大的应用价值。
[0003]相关技术在利用轨迹数据进行用户识别的研究中,大多基于规则的网格展开(如矩形、六边形等),然而城市路网与地形分布对人、车等运动物体的轨迹形成有着巨大的影响,规则的网格忽略了真实的地理位置信息,无法有效地反应用户真实的访问位置;同时,除频繁访问位置外,用户在地理空间上的移动路径信息也具有独特性,用户在访问位置间的移动路径可能是不同的,现有的研究方向中未曾同时利用频繁访问位置和移动路径信息构造用户轨迹特征,无法充分表示用户的移动行为。以往的用户识别任务只用单一的相似性度量方法进行实验,没有考虑多个维度的相似性度量方法对实验结果的影响,更好地提高用户识别的效率。此外,相关研究未考虑数据集采样比例、表征集合规模、轨迹时长等因素对识别结果稳定性的影响。
[0004]所以,相关技术在利用轨迹路径识别多条轨迹所对应的用户真实身份信息的过程中,存在用户识别准确率较低,稳定性不高的问题。

技术实现思路

[0005]本申请提供了一种基于移动轨迹数据的用户识别方法、装置及存储介质,以至少解决相关技术中存在用户识别准确率较低,稳定性不高的问题。
[0006]根据本申请实施例的一个方面,提供了一种基于移动轨迹数据的用户识别方法,该方法包括:获取任意两条待判别的目标轨迹数据,其中,所述目标轨迹数据为从目标区域中提取出的路径信息,所述目标区域为用户访问过的区域;将所述目标轨迹数据的表征集合输入到目标模型内,判断所述目标轨迹数据是否来自同一用户,其中,所述目标模型是由初始判别模型训练得到的,输入所述初始判别模型的训练参数包括:任意两条初始轨迹数据之间的共现次数、任意两条初始轨迹数据之间的角度余弦值、任意两条初始轨迹数据之间的概率偏差值、任意两条初始轨迹数据之间的相似度数值以及用于指示任意两条初始轨迹数据是否来自同一所述用户的标注信息。
[0007]根据本申请实施例的另一个方面,还提供了一种基于移动轨迹数据的用户识别装置,该装置包括:第一获取单元,用于获取任意两条待判别的目标轨迹数据,其中,所述目标
轨迹数据为从目标区域中提取出的路径信息,所述目标区域为用户访问过的区域;得到单元,用于将所述目标轨迹数据的表征集合输入到目标模型内,判断所述目标轨迹数据是否来自同一用户,其中,所述目标模型是由初始判别模型训练得到的,输入所述初始判别模型的训练参数包括:任意两条初始轨迹数据之间的共现次数、任意两条初始轨迹数据之间的角度余弦值、任意两条初始轨迹数据之间的概率偏差值、任意两条初始轨迹数据之间的相似度数值以及用于指示任意两条初始轨迹数据是否来自同一所述用户的标注信息。
[0008]可选地,该装置还包括:第二获取单元,用于在所述将所述目标轨迹数据的表征集合输入到目标模型内之前,获取所述目标区域内的所有地图信息;第一生成单元,用于根据所述所有地图信息,生成所述所有地图信息所对应的所有的网格信息和所有的路段信息;第三获取单元,用于获取任意两条所述初始轨迹数据,其中,所述初始轨迹数据为用户访问所述目标区域时所产生的数据;第二生成单元,用于根据所述初始轨迹数据、所述网格信息和所述路段信息,生成所述用户访问的网格信息集合和所述用户途经的路段信息集合,其中,所述网格信息集合内包含各个子网格信息,所述子网格信息为用户在预设周期内访问次数大于第一预设阈值的网格信息,所述路段信息集合内包含各个子路段,所述子路段为用户在所述预设周期内途经次数大于第二预设阈值的路段信息;第三生成单元,用于根据所述网格信息集合和所述路段信息集合,生成所述初始轨迹数据之间的所述共现次数、所述角度余弦值、所述概率偏差值以及所述相似度数值。
[0009]可选地,第一生成单元包括:第一生成模块,用于根据所述所有地图信息,生成路网文件,其中,所述路网文件中包含所有道路信息中的道路边和道路交点;转换模块,用于将所述路网文件转换为栅格图片;操作模块,用于对所述栅格图片中的原始路网进行加工操作;提取模块,用于提取所述栅格图片中所有的所述网格信息和所有的所述路段信息。
[0010]可选地,第二生成单元包括:第一确定模块,用于根据所述初始轨迹数据,确定所述用户的行动轨迹点;第二确定模块,用于根据所述行动轨迹点、所述网格信息和所述路段信息,确定所述用户当前所处在的第一子网格信息和第一子路段信息;第二生成模块,用于在所述用户在所述预设周期内访问所述第一子网格信息的次数大于所述第一预设阈值的情况下,将所述第一子网格信息加入所述网格信息集合内,生成所述网格信息集合;在所述用户在所述预设周期内途经所述第一子路段信息的次数大于所述第二预设阈值的情况下,将所述第一子路段信息加入所述路段信息集合内,生成所述路段信息集合。
[0011]可选地,第二生成单元包括:获取模块,用于获取所述网格信息集合内各个所述第一子网格信息的第一分布频率和所述路段信息集合内各个所述第一子路段信息的第二分布频率;第一得到模块,用于按照从大到小的顺序依次对所述第一分布频率和所述第二分布频率进行排列,得到第一排列序列和第二排列序列;选取模块,用于选取所述第一排列序列中位于前预设个数的子网格编号和所述第二排列序列中位于前所述预设个数的子路段编号;第二得到模块,用于将所述子网格编号对应的子网格信息进行集合,得到所述网格信息集合,将所述子路段编号对应的子路段信息进行集合,得到所述路段信息集合。
[0012]可选地,第三生成单元包括:第三得到模块,用于根据所述网格信息集合和所述路段信息集合,得到所述初始行动轨迹之间的出现的所述共现次数,其中,所述共现次数为所述初始行动轨迹之间共同出现网格信息和路段信息的次数;第四得到模块,用于根据所述网格信息集合、所述路段信息集合、所述共现次数,得到所述初始行动轨迹之间的所述角度
余弦值,其中,所述角度余弦值依据所述初始行动轨迹之间出现共现区间的个数;第五得到模块,用于根据所述网格信息集合、所述路段信息集合、所述初始行动轨迹访问所述子网格信息的数量和途经所述子路段信息的数量,得到所述初始行动轨迹之间的所述概率偏差值,其中,所述概率偏差值同时依据所述初始行动轨迹之间出现共现区间和非共现区间的个数;第六得到模块,用于根据所述网格信息集合、所述路段信息集合、所述共现次数,得到所述相似度数值,其中,所述相似度数值用于表征所述初始行动轨迹之间的相似度。
[0013]可选地,第三得到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于移动轨迹数据的用户识别方法,其特征在于,所述方法包括:获取任意两条待判别的目标轨迹数据,其中,所述目标轨迹数据为从目标区域中提取出的路径信息,所述目标区域为用户访问过的区域;将所述目标轨迹数据的表征集合输入到目标模型内,判断所述目标轨迹数据是否来自同一用户,其中,所述目标模型是由初始判别模型训练得到的,输入所述初始判别模型的训练参数包括:任意两条初始轨迹数据之间的共现次数、任意两条初始轨迹数据之间的角度余弦值、任意两条初始轨迹数据之间的概率偏差值、任意两条初始轨迹数据之间的相似度数值以及用于指示任意两条初始轨迹数据是否来自同一所述用户的标注信息。2.根据权利要求1所述的方法,其特征在于,在所述将所述目标轨迹数据的表征集合输入到目标模型内之前,所述方法还包括:获取所述目标区域内的所有地图信息;根据所述所有地图信息,生成所述所有地图信息所对应的所有的网格信息和所有的路段信息;获取任意两条所述初始轨迹数据,其中,所述初始轨迹数据为用户访问所述目标区域时所产生的数据;根据所述初始轨迹数据、所述网格信息和所述路段信息,生成所述用户访问的网格信息集合和所述用户途经的路段信息集合,其中,所述网格信息集合内包含各个子网格信息,所述子网格信息为用户在预设周期内访问次数大于第一预设阈值的网格信息,所述路段信息集合内包含各个子路段,所述子路段为用户在所述预设周期内途经次数大于第二预设阈值的路段信息;根据所述网格信息集合和所述路段信息集合,生成所述初始轨迹数据之间的所述共现次数、所述角度余弦值、所述概率偏差值以及所述相似度数值。3.根据权利要求2所述的方法,其特征在于,所述根据所述所有地图信息,生成所述所有地图信息所对应的所有的网格信息和所有的路段信息包括:根据所述所有地图信息,生成路网文件,其中,所述路网文件中包含所有道路信息中的道路边和道路交点;将所述路网文件转换为栅格图片;提取所述栅格图片中所有的所述网格信息和所有的所述路段信息。4.根据权利要求2所述的方法,其特征在于,所述根据所述初始轨迹数据、所述网格信息和所述路段信息,生成所述用户访问的网格信息集合和所述用户途经的路段信息集合包括:根据所述初始轨迹数据,确定所述用户的行动轨迹点;根据所述行动轨迹点、所述网格信息和所述路段信息,确定所述用户当前所处在的第一子网格信息和第一子路段信息;在所述用户在所述预设周期内访问所述第一子网格信息的次数大于所述第一预设阈值的情况下,将所述第一子网格信息加入所述网格信息集合内,生成所述网格信息集合;在所述用户在所述预设周期内途经所述第一子路段信息的次数大于所述第二预设阈值的情况下,将所述第一子路段信息加入所述路段信息集合内,生成所述路段信息集合。5.根据权利要求4所述的方法,其特征在于,所述生成所述用户访问的网格信息集合和
所述用户途经的路段信息集合包括:获取所述网格信息集合内各个所述第一子网格信息的第一分布频率和所述路段信息集合内各个所述第一子路段信息的第二分布频率;按照从大到小的顺序依次对所述第一分...

【专利技术属性】
技术研发人员:王丽宏郭舒范越贺敏刘婧王惠文王珂瑶黄洪仁王士承钟盛海
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1