一种地图兴趣点判重的方法、装置及电子设备制造方法及图纸

技术编号:24331187 阅读:34 留言:0更新日期:2020-05-29 19:39
本发明专利技术公开了一种地图兴趣点判重的方法、装置及电子设备,该方法包括:获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征;以及获取第一属性特征与第二属性特征中相同类型的属性特征之间的相似度,并将该相似度作为第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;进而,将第一属性特征、第二属性特征以及交叉特征输入预先训练好的机器学习模型中,通过机器学习模型对第一地图兴趣点和所述第二地图兴趣点是否相同进行判定并输出判定结果,使得兴趣点的判重基于兴趣点的各属性特征、各属性特征之间的相似度等多个维度以全局最优的方式进行判定,解决了现有技术中POI判重存在的准确率差的技术问题,提高了判重准确率。

A method, device and electronic equipment for determining the weight of map interest points

【技术实现步骤摘要】
一种地图兴趣点判重的方法、装置及电子设备
本专利技术涉及地理信息系统领域,特别涉及一种地图兴趣点判重的方法、装置及电子设备。
技术介绍
在地理信息系统领域,通常会设置兴趣点(PointOfInteresting,POI),用来形容地图上的点。地图上,每一个需要被检索的点都可以是一个POI,存储在数据库中,用户需要查找的时候,根据用户所输入的关键词,找到对应POI,并显示在搜索界面上。一个POI的表达形式有多种,例如:“清华大学”、“清华大学北门”、“北京市海淀区双清路30号”可能表示的是同一个POI,为此,需要一个对POI判重的过程,判定数据库中的两条POI是否是同一个点,为检索提供更准确结果。现有的POI判重的处理方法,通常是通过条件判断方法来实现,例如:分别计算两个POI对应的名称相似度、地址相似度、坐标距离等属性特征,若名称相似度满足条件1、地址相似度满足条件2、坐标距离满足条件3则认为这两个POI相同或不相同的POI。这种条件判断的方法往往只适用于简单的POI判重,对于包含多个属性特征的POI,条件设置的复杂度呈几何倍数增加、其综合性越来越差,导致判重的准确率大大降低。
技术实现思路
本专利技术实施例提供一种地图兴趣点判重的方法、装置及电子设备,用于解决现有技术中POI判重存在的准确率差的技术问题。第一方面,本专利技术实施例提供一种地图兴趣点判重的方法,该方法包括:获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,并输出判定结果。可选的,所述在输出判定结果之前,所述方法还包括:将所述第一地图兴趣点和所述第二地图兴趣点与预设的地图兴趣点白名单和/或黑名单进行对比;若预设的地图兴趣点白名单和/或黑名单中包含与所述第一地图兴趣点和所述第二地图兴趣点相同的地图兴趣点对,获取预设的地图兴趣点白名单和/或黑名单中所述地图兴趣点对的重复标识;基于所述重复标识修正所述判定结果;所述输出判定结果包括:输出修正后的所述判定结果。可选的,所述预先训练好的机器学习模型的训练方法包括:获取参考实例集,所述参考实例集中每个参考实例包括两个地图兴趣点、所述两个地图兴趣点的属性信息以及表征所述两个地图兴趣点是否相同的重复标识;针对所述每个参考实例,对所述两个地图兴趣点的属性信息进行特征提取并向量化,获得每个地图兴趣点的属性特征;获取所述两个地图兴趣点对应的相同类型的属性特征之间的相似度,并将所述相似度作为所述两个兴趣点之间的交叉特征;将每个参考实例的两个地图兴趣点对应的所述属性特征、所述交叉特征及所述重复标识作为训练样本进行机器学习模型训练。可选的,所述训练样本包括预设比例的正样本和负样本,其中,所述正样本对应的两个地图兴趣点相同,所述负样本对应的两个地图兴趣点不相同。可选的,所述属性特征包括:地图兴趣点的名称、地址、坐标和/或类别;所述交叉特征包括:名称相似度、地址相似度、坐标之间的距离和/或类别相似度。可选的,所述机器学习模型包括:线性回归、决策树、随机森林、梯度提升树或者神经网络。第二方面,本专利技术实施例提供一种地图兴趣点判重的装置,所述装置包括:获取单元,用于获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;计算单元,用于获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;判断单元,用于将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,获得判定结果;输出单元,用于输出所述判定结果。可选的,所述装置还包括:比较单元,用于在输出判定结果之前,将所述第一地图兴趣点和所述第二地图兴趣点与预设的地图兴趣点白名单和/或黑名单进行对比;若预设的地图兴趣点白名单和/或黑名单中包含与所述第一地图兴趣点和所述第二地图兴趣点相同的地图兴趣点对,获取预设的地图兴趣点白名单和/或黑名单中所述地图兴趣点对的重复标识;所述判断单元,还用于基于所述重复标识修正所述判定结果;所述输出单元,还用于输出修正后的所述判定结果。可选的,所述装置还包括训练单元,所述训练单元用于:获取参考实例集,所述参考实例集中每个参考实例包括两个地图兴趣点、所述两个地图兴趣点的属性信息以及表征所述两个地图兴趣点是否相同的重复标识;针对所述每个参考实例,对所述两个地图兴趣点的属性信息进行特征提取并向量化,获得每个地图兴趣点的属性特征;获取所述两个地图兴趣点对应的相同类型的属性特征之间的相似度,并将所述相似度作为所述两个兴趣点之间的交叉特征;将每个参考实例的两个地图兴趣点对应的所述属性特征、所述交叉特征及所述重复标识作为训练样本进行机器学习模型训练。可选的,所述训练样本包括预设比例的正样本和负样本,其中,所述正样本对应的两个地图兴趣点相同,所述负样本对应的两个地图兴趣点不相同。可选的,所述属性特征包括:地图兴趣点的名称、地址、坐标和/或类别;所述交叉特征包括:名称相似度、地址相似度、坐标之间的距离和/或类别相似度。可选的,所述机器学习模型包括:线性回归、决策树、随机森林、梯度提升树或者神经网络。第三方面,本专利技术实施例提供一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,并输出判定结果。第四方面,本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获取待判定的第一地图兴趣点的第一属性特征和第二地图本文档来自技高网...

【技术保护点】
1.一种地图兴趣点判重的方法,其特征在于,所述方法包括:/n获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;/n获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;/n将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,并输出判定结果。/n

【技术特征摘要】
1.一种地图兴趣点判重的方法,其特征在于,所述方法包括:
获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;
获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;
将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,并输出判定结果。


2.如权利要求1所述的方法,其特征在于,所述在输出判定结果之前,所述方法还包括:
将所述第一地图兴趣点和所述第二地图兴趣点与预设的地图兴趣点白名单和/或黑名单进行对比;
若预设的地图兴趣点白名单和/或黑名单中包含与所述第一地图兴趣点和所述第二地图兴趣点相同的地图兴趣点对,获取预设的地图兴趣点白名单和/或黑名单中所述地图兴趣点对的重复标识;
基于所述重复标识修正所述判定结果;
所述输出判定结果包括:输出修正后的所述判定结果。


3.如权利要求1所述的方法,其特征在于,所述预先训练好的机器学习模型的训练方法包括:
获取参考实例集,所述参考实例集中每个参考实例包括两个地图兴趣点、所述两个地图兴趣点的属性信息以及表征所述两个地图兴趣点是否相同的重复标识;
针对所述每个参考实例,对所述两个地图兴趣点的属性信息进行特征提取并向量化,获得每个地图兴趣点的属性特征;获取所述两个地图兴趣点对应的相同类型的属性特征之间的相似度,并将所述相似度作为所述两个兴趣点之间的交叉特征;
将每个参考实例的两个地图兴趣点对应的所述属性特征、所述交叉特征及所述重复标识作为训练样本进行机器学习模型训练。


4.如权利要求3所述的方法,其特征在于,所述训练样本包括预设比例的正样本和负样本,其中,所述正样本对应的两个地图兴趣点相同,所述负样本对应的两个地图兴趣点不相同。


5.如权利要求1~4任一所述的方法,其特征在于,所述属性特征包括:地图兴趣点的名称、地址、坐标和/或类别;
所述交叉特征包括:名称相似度、地址相似度、坐标之间的距离和/或类别相似度。


6.如权利要求1~4任一所述的方法,其特征在于,所述机器学习模型包括:
线性回归、决策树、随机森林、梯度提升树或者神经网络。


7.一种地图兴趣点判重的装置,其特征在于,所述装置包括:
获取单元,用于获取待判定的第一地图兴趣点的第一属性特征和第二地图...

【专利技术属性】
技术研发人员:高彬罗京杨雨然
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1