轨迹点的归一方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号:36224369 阅读:23 留言:0更新日期:2023-01-04 12:23
本公开涉及一种轨迹点的归一方法、装置、电子设备及计算机可读介质,属于数据处理技术领域。该方法包括:获取待处理的轨迹数据,轨迹数据中包含至少一个轨迹点的轨迹点信息,轨迹点信息包括轨迹点的位置信息;根据位置信息确定每一轨迹点对应的位置分数,并根据位置分数将多个轨迹点组成多个数据对;根据数据对中的两个轨迹点对应的轨迹点信息,得到数据对中轨迹点的相似度特征;将数据对的相似度特征输入轨迹点归一模型中,得到数据对中的两个轨迹点的合并概率,并根据合并概率判断数据对中的两个轨迹点是否能够合并。本公开通过构造数据对以及对应的特征,并通过数据归一模型判断两条轨迹数据是否能够合并,可以实现自动进行轨迹点归一的过程。点归一的过程。点归一的过程。

【技术实现步骤摘要】
轨迹点的归一方法、装置、电子设备及计算机可读介质


[0001]本公开涉及数据处理
,具体而言,涉及一种轨迹点的归一方法、轨迹点的归一装置、电子设备及计算机可读介质。

技术介绍

[0002]传染病是通过传染源、传播途径和易感人群这三个基本环节进行传播的。传染病患者的流行病学调查报告中包含有大量的轨迹数据,随着自然语言处理技术和数据挖掘技术在流行病学调查中的深入应用,流调研判工作者需要从流调报告的大量轨迹数据中获取丰富的时空信息,因此轨迹数据的分析处理成为了流行病学调查相关数据挖掘方向研究的重点。
[0003]在轨迹数据的分析过程中,由于病例的描述不同,在流调报告中对于同一地址会出现不同的描述,即轨迹数据存在很多地名歧义的问题,主要表现为同一个地址出现不同的命名方式。因此在对轨迹信息中地址名字段进行数据挖掘或分析前,需要先对轨迹信息进行预处理,将指向同一地址的不同命名方式进行统一,即轨迹点归一。
[0004]目前轨迹点归一主要是通过对目标地址进行切分处理,得到与目标地址对应的市、区等各级地址元素。然后根据目标地址的各级元素,通本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种轨迹点的归一方法,其特征在于,包括:获取待处理的多个用户的轨迹数据,其中,所述轨迹数据中包含至少一个轨迹点的轨迹点信息,所述轨迹点信息包括所述轨迹点的位置信息;根据所述位置信息确定每一轨迹点对应的位置分数,并根据每一轨迹点对应的位置分数,将多个所述轨迹点组成多个数据对;根据每一数据对中的两个轨迹点对应的轨迹点信息,得到所述数据对中轨迹点的相似度特征,所述相似度特征包括位置相似度和轨迹点相似度;将每一数据对中轨迹点的相似度特征输入预先训练的轨迹点归一模型中,得到每一数据对中的两个轨迹点的合并概率,并根据所述合并概率判断所述数据对中的两个轨迹点是否能够合并。2.根据权利要求1所述的轨迹点的归一方法,其特征在于,所述根据所述位置信息确定每一轨迹点对应的位置分数,包括:从所述位置信息中获取所述轨迹点的经度值和纬度值,并对所述经度值和所述纬度值进行数据降维计算,得到所述轨迹点对应的位置分数。3.根据权利要求1所述的轨迹点的归一方法,其特征在于,所述根据每一轨迹点对应的位置分数,将多个所述轨迹点组成多个数据对,包括:根据每一轨迹点对应的位置分数,对所有所述轨迹点进行排序;根据所述轨迹点的排序结果,确定每两个轨迹点之间位置分数的差值;若两个轨迹点之间位置分数的差值小于或等于合并分数阈值,则将两个轨迹点组成一个数据对。4.根据权利要求1所述的轨迹点的归一方法,其特征在于,所述根据每一数据对中的两个轨迹点对应的轨迹点信息,得到所述数据对中轨迹点的相似度特征,包括:根据所述数据对中的两个轨迹点对应的位置信息得到两个轨迹点的经度值和纬度值,并根据两个轨迹点的经度值和纬度值得到所述数据对中轨迹点的位置相似度,其中,所述位置相似度包括经度差和纬度差;从所述数据对中的两个轨迹点的轨迹点信息中获取两个轨迹点的轨迹点名称,并根据两个轨迹点的轨迹点名称得到所述数据对中轨迹点的轨迹点相似度。5.根据权利要求4所述的轨迹点的归一方法,其特征在于,所述根据两个轨迹点的轨迹点名称得到所述数据对中轨迹点的轨迹点相似度,包括:根据两个轨迹点的轨迹点名称得到对应的句向量,并根据两个所述轨迹点名称的句向量之间的余弦相似度得到所述数据对中轨迹点的轨迹点相似度。6.根据权利要求1所述的轨迹点的归一方法,其特征在于,所述相似度特征还包括对象相似度,所述根据每一数据对中的两个轨迹点对应的轨迹点信息,得到所述数据对中轨迹点的相似度特征,包括:从所述数据对中的两个轨迹点的轨迹点信息中获取两个轨迹点的对象姓名,并根据两个轨迹点的对象姓名的一致性得到所述数据对中轨迹点的对象相似度。7.根据权利要求1所述的轨迹点的归一方法,其特征在于,所述轨迹点归一模型的训练方法...

【专利技术属性】
技术研发人员:李思敏王蕊秀隋敏程志达张霄
申请(专利权)人:医渡云北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1