【技术实现步骤摘要】
一种地图兴趣点判重的方法、装置及电子设备
本专利技术涉及地理信息系统领域,特别涉及一种地图兴趣点判重的方法、装置及电子设备。
技术介绍
在地理信息系统领域,通常会设置兴趣点(PointOfInteresting,POI),用来形容地图上的点。地图上,每一个需要被检索的点都可以是一个POI,存储在数据库中,用户需要查找的时候,根据用户所输入的关键词,找到对应POI,并显示在搜索界面上。一个POI的表达形式有多种,例如:“清华大学”、“清华大学北门”、“北京市海淀区双清路30号”可能表示的是同一个POI,为此,需要一个对POI判重的过程,判定数据库中的两条POI是否是同一个点,为检索提供更准确结果。现有的POI判重的处理方法,通常是通过条件判断方法来实现,例如:分别计算两个POI对应的名称相似度、地址相似度、坐标距离等属性特征,若名称相似度满足条件1、地址相似度满足条件2、坐标距离满足条件3则认为这两个POI相同或不相同的POI。这种条件判断的方法往往只适用于简单的POI判重,对于包含多个属性特征的POI,条件设置的复杂度呈几何倍数增加、其综合性越来越差,导致判重的准确率大大降低。
技术实现思路
本专利技术实施例提供一种地图兴趣点判重的方法、装置及电子设备,用于解决现有技术中POI判重存在的准确率差的技术问题。第一方面,本专利技术实施例提供一种地图兴趣点判重的方法,该方法包括:获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性 ...
【技术保护点】
1.一种地图兴趣点判重的方法,其特征在于,所述方法包括:/n获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;/n获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;/n将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,并输出判定结果。/n
【技术特征摘要】
1.一种地图兴趣点判重的方法,其特征在于,所述方法包括:
获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;
获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;
将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,并输出判定结果。
2.如权利要求1所述的方法,其特征在于,所述在输出判定结果之前,所述方法还包括:
将所述第一地图兴趣点和所述第二地图兴趣点与预设的地图兴趣点白名单和/或黑名单进行对比;
若预设的地图兴趣点白名单和/或黑名单中包含与所述第一地图兴趣点和所述第二地图兴趣点相同的地图兴趣点对,获取预设的地图兴趣点白名单和/或黑名单中所述地图兴趣点对的重复标识;
基于所述重复标识修正所述判定结果;
所述输出判定结果包括:输出修正后的所述判定结果。
3.如权利要求1所述的方法,其特征在于,所述预先训练好的机器学习模型的训练方法包括:
获取参考实例集,所述参考实例集中每个参考实例包括两个地图兴趣点、所述两个地图兴趣点的属性信息以及表征所述两个地图兴趣点是否相同的重复标识;
针对所述每个参考实例,对所述两个地图兴趣点的属性信息进行特征提取并向量化,获得每个地图兴趣点的属性特征;获取所述两个地图兴趣点对应的相同类型的属性特征之间的相似度,并将所述相似度作为所述两个兴趣点之间的交叉特征;
将每个参考实例的两个地图兴趣点对应的所述属性特征、所述交叉特征及所述重复标识作为训练样本进行机器学习模型训练。
4.如权利要求3所述的方法,其特征在于,所述训练样本包括预设比例的正样本和负样本,其中,所述正样本对应的两个地图兴趣点相同,所述负样本对应的两个地图兴趣点不相同。
5.如权利要求1~4任一所述的方法,其特征在于,所述属性特征包括:地图兴趣点的名称、地址、坐标和/或类别;
所述交叉特征包括:名称相似度、地址相似度、坐标之间的距离和/或类别相似度。
6.如权利要求1~4任一所述的方法,其特征在于,所述机器学习模型包括:
线性回归、决策树、随机森林、梯度提升树或者神经网络。
7.一种地图兴趣点判重的装置,其特征在于,所述装置包括:
获取单元,用于获取待判定的第一地图兴趣点的第一属性特征和第二地图...
【专利技术属性】
技术研发人员:高彬,罗京,杨雨然,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。