一种地址编码方法、装置、电子设备和存储介质制造方法及图纸

技术编号:23764578 阅读:43 留言:0更新日期:2020-04-11 19:09
本发明专利技术实施例公开了一种地址编发方法、装置、电子设备和存储介质,其中方法包括:获取待编码地址,基于分词关键字对待编码地址进行分词,得到至少一个分词分片;将各分词分片依次与行政区划对照表进行比对,并将存在于行政区划对照表中的分词分片作为地址分片;在预先构建的POI树上,依次将各地址分片与POI树的节点进行匹配,根据匹配结果确定与待编码地址相匹配的目标POI;根据目标POI的信息对待编码地址进行编码。本发明专利技术实施例通过分词关键字和行政区划对照相结合的方式确定地址分片,提升了确定地址分片的准确性。而且通过将地址分片与POI树匹配的方式确定目标POI,解决了lucence等基于文本的匹配算法中中文地址分片相互识别干扰问题。

An address coding method, device, electronic equipment and storage medium

【技术实现步骤摘要】
一种地址编码方法、装置、电子设备和存储介质
本专利技术实施例涉及互联网
,尤其涉及一种地址编码方法、装置、电子设备和存储介质。
技术介绍
地址编码是一种空间定位的编码方法,支持将可描述性的地址信息转换为空间经纬度,广泛运用于地图应用。方法应将可描述性的中文地址尽可能的与兴趣点(PointofInterest,POI)建立关联,从而以兴趣点中的经纬度作为转换结果。现有的方法主要有两类:(1)将中文地址、poi地址按对照词库进行分词,再计算两者分词分片的相似度,从而获取最相似的poi中的经纬度信息。(2)采用lucence等文本相似度匹配工具,计算中文地址与poi地址的相似度,从而获取最相似的poi中的经纬度信息。然而这两种方式都存在一定的不足,第一种方法严重依赖词库的丰富程度,但是街道名、小区名等地址信息经常调整,并且数量非常大,使得中文地址正确分词变得几乎无法实现。第二种方法依赖文本相似度来计算中文地址与poi地址的相似度极易出现偏差,例如上海市重庆南路中的重庆二字因为文本相似,会有一定概率被误认为是重庆市。另外中文地址在本文档来自技高网...

【技术保护点】
1.一种地址编码方法,其特征在于,所述方法包括:/n获取待编码地址,基于分词关键字对所述待编码地址进行分词,得到至少一个分词分片,其中,所述分词关键字包括表征地址层次结构的字;/n将各分词分片依次与行政区划对照表进行比对,并将存在于所述行政区划对照表中的分词分片作为地址分片;/n在预先构建的POI树上,依次将各所述地址分片与所述POI树的节点进行匹配,根据匹配结果确定与所述待编码地址相匹配的目标POI;其中,所述POI树是由表示地址层次结构的节点构成;/n根据所述目标POI的信息对所述待编码地址进行编码。/n

【技术特征摘要】
1.一种地址编码方法,其特征在于,所述方法包括:
获取待编码地址,基于分词关键字对所述待编码地址进行分词,得到至少一个分词分片,其中,所述分词关键字包括表征地址层次结构的字;
将各分词分片依次与行政区划对照表进行比对,并将存在于所述行政区划对照表中的分词分片作为地址分片;
在预先构建的POI树上,依次将各所述地址分片与所述POI树的节点进行匹配,根据匹配结果确定与所述待编码地址相匹配的目标POI;其中,所述POI树是由表示地址层次结构的节点构成;
根据所述目标POI的信息对所述待编码地址进行编码。


2.根据权利要求1所述的方法,其特征在于,所述将各分词分片依次与行政区划对照表进行比对,将存在于所述行政区划对照表中的分词分片作为地址分片,包括:
将各分词分片依次与行政区划对照表进行比对,如果任一目标分词分片存在于所述行政区划对照表中,则判断是否存在与所述目标分词分片同名的行政区域;
若存在,则根据所述同名的行政区域所属的上一级的行政区域,确定地址分片;
若不存在,则将所述目标分词分片作为地址分片。


3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果未得到地址分片,则将任意相邻两个分词分片组合成新分词分片;
从所述新分词分片中选择不同数量的字的组合依次与行政区划对照表进行比对,将存在于所述行政区划对照表中的组合作为地址分片。


4.根据权利要求1所述的方法,其特征在于,在确定地址分片之后,所述方法还包括:
如果检测到某一地址分片对应的行政区划存在变更调整,则用该行政区划变更后的名称替换该地址分片;
如果根据行政区划的层次结构信息,确定某一地址分片中缺少分片,则将缺失的分片补齐。


5.根据权利要求1所述的方法,其特征在于,预先构建POI树的操作包括:
获取POI文件中的POI地址,基于分词关键字对所述POI地址进行分词,得到至少一个分词分片,其中所述分词关键字包括表征地址层次结构的字;
将各分词分片依次与行政区划对照表进行比对,并将存在于所述行政区划对照表中的分词分片作为POI地址分片;
将所述POI地址分片作为节点,并根据所述POI地址分片的层次结构将各节点组装成POI树。


6.根据权利要求1所述的方法,其特征在于,在预先构建的POI树上,依次将各所述地址分片与所述POI树的节点进行匹配,根据匹配结果确定与所述待编码地址最相似的目标POI,包括:
S1.将排在首位的地址分片与...

【专利技术属性】
技术研发人员:张海攀汤益嘉刘强
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1