本发明专利技术公开了多重判据约束的POI匹配方法及装置,该方法包括:S1:获取待计算POI对应的地图服务源提供的实验数据;S2:利用多重属性约束计算所述实验数据的相似度;S3:确定所述实验数据的规则阈值;S4:利用多重判据约束规则舍弃不满足条件的POI信息;S5:匹配和融合符合多重判据约束规则的POI。本发明专利技术采用多重判据约束计算方法,通过提升属性相似度计算及综合判据约束规则,在POI匹配精准性表现明显优于现有匹配方法,误匹配和漏匹配数均为0,实现更全、更精准的POI匹配。
【技术实现步骤摘要】
一种多重判据约束的POI匹配方法及装置
本专利技术属于电子地图
,具体涉及一种多重判据约束的POI(PointofInterest,兴趣点)匹配方法及装置。
技术介绍
POI匹配是多源POI融合更新的关键环节,也是融合更新工作中的技术难点,多源POI的准确匹配对于实现POI数据有效复用具有重要意义。多源POI实体匹配方法主要包括基于空间属性方法(Yangetal.,2014;Zhangetal.,2014)、基于非空间属性方法以及基于空间和非空间结合的方法(Yangetal.,2015;Huangetal.,2018)。基于空间和非空间结合的方法具有融合空间距离和名称等非空间属性的优势,成为多源POI实体匹配最有效的方法。McKenzieaetal(2014)提出了一种综合空间位置距离、名称属性、主题相似度等多属性加权POI匹配策略,并指出多属性结合方法能够有效解决单一特征属性匹配精度低的问题。黄梦龙等(2018)在空间位置属性的基础上利用非空间属性名称相似度提高不同来源POI数据融合集的准确性。Lietal(2016)和Dengetal(2019)提出了多属性相似度与合适的属性权重分配相结合的POI匹配方法,并证明了所有多属性模型中,综合空间距离、名称和类别属性的模型在POI实体匹配中效果最好。然而,已有基于空间和非空间结合的方法利用多重属性约束时,仍存在计算方法及约束规则不严谨等问题。如名称语义约束不严谨:已有研究通常直接基于字符串进行名称相似度计算,易导致相似度很高实则为不同POI的实体判别错误;类别距离多使用弱约束,导致不同小类别的POI实体判别不准确;空间属性仅考虑位置距离约束,未考虑实体间的空间拓扑关系等,均会导致POI匹配度不高、效果较差等问题。因此,如何提供一种能够解决上述问题的POI匹配方法及装置是本领域技术人员亟需解决的问题。
技术实现思路
有鉴于此,本专利技术提供了一种多重判据约束的POI匹配方法及装置。为了实现上述目的,本专利技术采用如下技术方案:一种多重判据约束的POI匹配方法,其特征在于,所述方法包括:S1:获取待计算POI对应的地图服务源提供的实验数据;S2:利用多重属性约束计算所述实验数据的相似度;S3:确定所述实验数据的规则阈值;S4:利用多重判据约束规则舍弃不满足条件的POI信息;S5:匹配和融合符合多重判据约束规则的POI。优选的,所述步骤S2中所述的多重属性约束计算包括:名称相似度计算、地址相似度计算、类别相似度计算、顾及空间拓扑关系的空间约束计算。优选的,所述步骤S3中所述的实验数据的规则阈值包括:名称相似度阈值确定、地址相似度阈值确定和空间相似度阈值确定。优选的,所述步骤S4中选取初步匹配集,若符合多重判据约束规则,则进入初步匹配集过滤步骤,若复合条件则进入步骤S5;若上述任一条件不符合,则舍弃。优选的,所述步骤S1中的地图服务源为高德地图和百度地图。一种多重判据约束的POI匹配装置,其特征在于,包括:获取单元,用于获取待计算POI对应的地图服务源提供的实验数据;第一计算单元,用于对所述获取单元所获取数据进行多重属性约束计算;第二计算单元,用于对所述第一计算单元中的数据进行规则阈值的确定;第三计算单元,用于选取初步匹配集并对选取的初步匹配集进行过滤,舍弃不符合条件的匹配集;第四计算单元,用于对所述第三计算单元中复合条件的初选匹配集进行POI匹配融合。优选的,所述第一计算单元具体用于:对所述获取单元数据进行名称相似度计算、地址相似度计算、类别相似度计算和顾及空间拓扑关系的空间约束计算。优选的,所述第二计算单元具体用于:对名称相似度阈值确定、地址相似度阈值确定和空间相似度阈值确定。优选的,所述第三计算单元具体用于:选取初步匹配集,若符合多重判据约束规则,则进入初步匹配集过滤步骤,若复合条件则进入步骤S5;若上述任一条件不符合,则舍弃。优选的,所述获取单元具体用于:获取实验数据为高德地图和百度地图的地图服务源数据。经由上述的技术方案可知,与现有技术相比,本专利技术提供了一种多重判据约束的POI匹配方法及装置,通过提升属性相似度计算及综合判据约束规则,在POI匹配精准性表现明显优于现有匹配方法,误匹配和漏匹配数均为0,实现更全、更精准的POI匹配。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术一种多重判据约束的POI匹配方法流程图;图2为本专利技术一种多重判据约束的POI匹配装置示意图;具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见附图1所示,本专利技术实施例公开了一种多重判据约束的POI匹配方法的流程图,可以包括以下步骤:S1:获取待计算POI对应的地图服务源提供的实验数据;S2:利用多重属性约束计算所述实验数据的相似度;S3:确定所述实验数据的规则阈值;S4:利用多重判据约束规则舍弃不满足条件的POI信息;S5:匹配和融合符合多重判据约束规则的POI。其中,在步骤S1中,所获取实验数据为高德地图和百度地图所提供;步骤S2将步骤S1所获取的数据进行多重属性约束计算,多重属性约束计算包括名称相似度计算、地址相似度计算、类别相似度计算和顾及空间拓扑关系的空间约束计算。S21:名称相似度计算:词语角色构成:根据词语在POI名称构成中的作用,分为地名(D)、专名(Z)、修饰词(X)、方位词(F)、数字词(S)、通名(T)和特殊字符(Y);因此,POI名称构成的词语角色集合NB={D,Z,X,F,S,T,Y}。词语角色标注:首先,利用正则表达式识别出POI名称中的方位词、数字词和特殊字符。其次,基于包含地名、修饰词和通名以及相应角色标签的词典库,利用角色标注的HMM模型对名称文本进行分词赋予相应角色,其中词典结构为:词语,角色,次数。最后,对没有赋予角色的词语均统归为专名,赋予角色为Z。相似度计算:实际POI名称中,由于针对D、X、T以及Y的角色可能表示不全,加之它们对整体相似度贡献非常小甚至会混淆整体相似度计算,因此在名称相似度计算时针对名称词语进行剪枝处理,角色为D、X、T以及Y的词语不纳入计算,只需根据角色为专名(Z)、方位词(F)和数字词(S)的词语进行相似度计算。具体计算公式如下:其中,N表示名称相似度,Wi表示名称中某角本文档来自技高网...
【技术保护点】
1.一种多重判据约束的POI匹配方法,其特征在于,所述方法包括:/nS1:获取待计算POI对应的地图服务源提供的实验数据;/nS2:利用多重属性约束计算所述实验数据的相似度;/nS3:确定所述实验数据的规则阈值;/nS4:利用多重判据约束规则舍弃不满足条件的POI信息;/nS5:匹配和融合符合多重判据约束规则的POI。/n
【技术特征摘要】
1.一种多重判据约束的POI匹配方法,其特征在于,所述方法包括:
S1:获取待计算POI对应的地图服务源提供的实验数据;
S2:利用多重属性约束计算所述实验数据的相似度;
S3:确定所述实验数据的规则阈值;
S4:利用多重判据约束规则舍弃不满足条件的POI信息;
S5:匹配和融合符合多重判据约束规则的POI。
2.根据权利要求1所述的一种多重判据约束的POI匹配方法,其特征在于,所述步骤S2中所述的多重属性约束计算包括:名称相似度计算、地址相似度计算、类别相似度计算、顾及空间拓扑关系的空间约束计算。
3.根据权利要求1所述的一种多重判据约束的POI匹配方法,其特征在于,所述步骤S3中所述的实验数据的规则阈值包括:名称相似度阈值确定、地址相似度阈值确定和空间相似度阈值确定。
4.根据权利要求1所述的一种多重判据约束的POI匹配方法,其特征在于,所述步骤S4中选取初步匹配集,若符合多重判据约束规则,则进入初步匹配集过滤步骤,若复合条件则进入步骤S5;若上述任一条件不符合,则舍弃。
5.根据权利要求1~4所述的一种多重判据约束的POI匹配方法,其特征在于,所述步骤S1中的地图服务源为高德地图和百度地图。
6.一种多重判据约束的POI匹配装置,其特征在于,包括:...
【专利技术属性】
技术研发人员:李成名,刘丽,戴昭鑫,吴政,朱立宁,杨霄,孙伟,张成成,路文娟,方驰宇,
申请(专利权)人:中国测绘科学研究院,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。