【技术实现步骤摘要】
一种基于级别索引的地址匹配方法与设备
[0001]本申请涉及计算机
,尤其涉及一种基于级别索引的地址匹配技术。
技术介绍
[0002]现有的地址匹配方法将获取到的待匹配地址与所有地址进行逐一匹配,匹配效率较低,没有利用地址信息中的各个级别词进行匹配范围的限缩,也没有基于行政区域等级进行层级性的匹配,导致其匹配效率及匹配准确性都存在较大的提升空间。
技术实现思路
[0003]本申请的目的是提供一种基于级别索引的地址匹配方法与设备。
[0004]根据本申请的一个方面,提供了一种基于级别索引的地址匹配方法,预设包含由各级级别词构成的行政区域词的行政区域库,其中,所述方法包括:
[0005]基于所述行政区域库建立各行政区域等级对应的级别索引,其中,所述级别索引的各个键为该级别索引对应的行政区域等级的行政区域词的最低级别词;
[0006]将获取到的待匹配的一个或多个地址拆分为由若干个级别词构成的词组集;
[0007]对于所述词组集中的各个级别词,在各级别索引中确定与该级别词相同的键 ...
【技术保护点】
【技术特征摘要】
1.一种基于级别索引的地址匹配方法,预设包含由各级级别词构成的行政区域词的行政区域库,其中,所述方法包括:基于所述行政区域库建立各行政区域等级对应的级别索引,其中,所述级别索引的各个键为该级别索引对应的行政区域等级的行政区域词的最低级别词;将获取到的待匹配的一个或多个地址拆分为由若干个级别词构成的词组集;对于所述词组集中的各个级别词,在各级别索引中确定与该级别词相同的键,并将该键对应的行政区域词加入候选集;基于所述词组集与所述候选集中的行政区域词的匹配结果,确定与所述一个或多个地址匹配的行政区域词。2.根据权利要求1所述的方法,所述级别索引的键对应的值为该键对应的行政区域词中除所述最低级别词外的级别词构成的多元组,其中,所述基于所述行政区域库建立各行政区域等级对应的级别索引包括:基于所述行政区域库建立最低行政区域等级对应的级别索引;基于该最低行政区域等级对应的级别索引中的所述多元组递归式的顺次建立其余由低至高的行政区域等级对应的级别索引。3.根据权利要求2所述的方法,所述行政区域等级包括省、地、县及乡,所述行政区域词的级别词包括省级词、地级词、县级词及乡级词,所述级别索引包括省级索引、地级索引、县级索引及乡级索引,其中,所述基于所述行政区域库建立最低行政区域等级对应的级别索引包括:对于所述行政区域库中乡级词不为空的各个行政区域词,将该行政区域的乡级词作为所述乡级索引的一个键,并将由该行政区域词的省级词、地级词、县级词顺序构成的三元组作为该键对应的值;其中,所述基于该最低行政区域等级对应的级别索引中的所述多元组递归式的顺次建立其余由低至高的行政区域等级对应的级别索引包括:对于所述乡级索引中的各个三元组,将该三元组中的县级词作为所述县级索引的一个键,并将由该三元组的省级词、地级词顺序构成的二元组作为该键对应的值;对于所述县级索引中的各个二元组,将该二元组中的地级词作为所述地级索引的一个键,并将由该二元组的省级词构成的一元组作为该键对应的值;对于所述地级索引中的各个一元组,将该一元组中的省级词作为所述省级索引的一个键,并将所述省级词作为该键对应的值。4.根据权利要求2或3所述的方法,其中,所述将在各级别索引中确定的与所述词组集中的各个级别词相同的键对应的行政区域词加入候选集包括:将在各级别索引中确定的与所述词组集中的各个级别词相同的键加入到该键对应的多元组中形成整合多元组,并将该整合多元组加入到所述候选集,其中,所述整合多元组即为以多元组形式保存的该键对应的行政区域词。5.根据权利要求4所述方法,其中,预设匹配分公式,所述基于所述词组集与所述候选集中的行政区域词的匹配结果,确定与所述一个或多个地址匹配的行政区域词包括:根据所述匹配分公式计算所述候选集中各个整合多元组与所述词组集的匹配分;将所述候选集中匹配分最大的一个或多个整...
【专利技术属性】
技术研发人员:向桥梁,
申请(专利权)人:连通杭州技术服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。