【技术实现步骤摘要】
轨迹异常点预测方法及装置、可读存储介质、电子设备
[0001]本公开涉及机器学习领域,尤其涉及一种轨迹异常点预测方法与轨迹异常点预测装置、计算机可读存储介质及电子设备。
技术介绍
[0002]与传染病病例对应的流调报告中包含着大量的轨迹数据,这些轨迹数据中包含了丰富的时空信息,这些信息成为了传染病相关数据挖掘方向的研究重点。然而,在流调报告拆解出的轨迹数据中包含着异常点数据(即与流调报告中原文描述的轨迹点不一致的轨迹数据),因此,为了得到准确的轨迹数据,必须预测出轨迹数据中包含的异常点数据。
[0003]在相关技术中,在轨迹异常点的预测过程中,所使用到的特征都是轨迹信息中本身包含的内容,这在一定程度上降低了轨迹异常点预测的准确度。
[0004]鉴于此,本领域亟需开发一种新的轨迹异常点预测方法及装置。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
[0006]本公开的目的在 ...
【技术保护点】
【技术特征摘要】
1.一种轨迹异常点预测方法,其特征在于,所述方法包括:获取多个用户的轨迹信息,所述轨迹信息中包括用户特征、多个轨迹点以及与所述多个轨迹点分别对应的地点信息和经纬度信息;利用与所述多个轨迹点分别对应的经纬度信息构建距离特征,利用与所述多个轨迹点分别对应的地点信息构建地点特征;基于所述用户特征、所述距离特征以及所述地点特征训练初始异常点预测模型,以得到异常点预测模型,所述异常点预测模型用于预测轨迹信息中是否包含轨迹异常点。2.根据权利要求1所述的轨迹异常点预测模型,其特征在于,所述距离特征包括:任意两个轨迹点之间的经度差、所述任意两个轨迹点之间的维度差、当前轨迹点距离与所述当前轨迹点具有轨迹相邻关系的上一轨迹点的第一距离差、所述当前轨迹点距离与所述当前轨迹点具有所述轨迹相邻关系的下一轨迹点的第二距离差、总距离差、最小距离差以及平均距离差;所述总距离差为所述第一距离差和所述第二距离差的和,所述最小距离差为所述第一距离差和所述第二距离差之中的一个目标距离差,所述平均距离差为所述总距离差的平均值。3.根据权利要求1所述的轨迹异常点预测模型,其特征在于,所述地点特征包括:与所述地点信息对应的地点字符长度、与所述地点信息对应的地点地区字段。4.根据权利要求1所述的轨迹异常点预测方法,其特征在于,所述初始异常点预测模型包括极端梯度提升树模型,所述极端梯度提升树模型中包括模型树;所述基于所述用户特征、所述距离特征以及所述地点特征训练初始异常点预测模型,包括:将所述用户特征、所述距离特征以及所述地点特征作为样本数据输入所述极端梯度提升树模型中,确定与当前轨迹点对应的轨迹预测值;根据所述样本数据、所述轨迹预测值以及与所有所述模型树对应的复杂度构建目标函数,并利用所述目标函数,确定用于所述模型树迭代的目标值;根据所述目标值设置所述模型树的数量以及所述模型树迭代次数,以对所述初始异常点预测模型进行训练得到所述异常点预测模型。5.根据权利要求4所述的轨迹异常点预测方法,其特征在于,所述方法还包括:根据所述轨迹预测值以及初始得分阈值确定所述样本数据的预测样本标签,确定与所述样本数据对应的真实样本类型;基于所述预测样本类型以及所述真实样本类型,计算模型准确率以及模型召回率;为所述模型准确率确定第一权重,为所述模型召回率确定第二权重,对所述模型准确率、所述第一权重、所述模型召回率以及所述第二权重进行计算得到目标得分阈值;所述目标得分阈值用于确定待预测轨迹信息的所述预测样本类型;将所述初始得分阈值更新为所述目标得分阈值,以继续根据与所述样本数据对应的所述轨迹预测值对所述目标得分阈值进行更新,直到将与所有用户对应的所述样本数据输入至...
【专利技术属性】
技术研发人员:李思敏,隋敏,王蕊秀,张霄,
申请(专利权)人:医渡云北京技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。