地址标准化方法和装置制造方法及图纸

技术编号:13913522 阅读:102 留言:0更新日期:2016-10-27 09:44
本发明专利技术公开了一种地址标准化方法,所述方法包括:当获取到待标准化地址时,从所述待标准化地址中提取关键词;根据所述关键词划分所述待标准化地址,得到所述待标准化地址的地址分词;将所述地址分词与预设地址库进行对比,得到对比结果;根据所述对比结果补全所述待标准化地址,使所述待标准化地址转化成标准化地址。本发明专利技术还公开了一种地址标准化装置。本发明专利技术实现了将由于用户书写习惯或者某些地区存在同名等现象所导致的通讯地址不规范或者不标准的地址转化为标准化形式的地址,提高了通讯地址处理的精确度和通讯地址处理的效率。

【技术实现步骤摘要】

本专利技术涉及通讯地址
,尤其涉及一种地址标准化方法和装置
技术介绍
通讯地址技术的应用领域非常广泛,与人们的日常生活也息息相关,如邮政领域的信件往来需要对通讯地址进行识别和处理、地理编码系统中首先需对通讯地址进行标准化、银行业务系统中需对地址数据进行存储、识别、更新等处理。通讯地址技术还可用于网络、电子商务、电子地图等等。通讯地址的不规范或者不标准,将会给人们带来诸多的不便。例如:由于用户地址的不规范,邮政系统需要投入大量的人力和物力去解决如何识别正确的、标准的通讯地址,否则将会造成错误投递、重复投递的情况,而随着邮政业务数据的增长,这种投入将相应地进行扩大,这种情况对邮政系统来说将难以承受。银行业务系统中也存在着用户地址的不规范问题,倘若银行业务系统没有对用户地址进行标准化的处理(事实上很多银行业务系统确实没有对用户地址进行标准化处理,用户地址的录入和更新都是人为的进行操作),随着业务系统的数据量增大,不同数据库的不兼容性,银行业务系统将面临着处理速度较慢、效率低下,业务系统数据混乱的现象,很容易造成客户的损失和流失。因此,将通讯地址标准化,使其转化为地理信息服务的基础成果,为大众的生产生活提供支撑,已成为一项迫切的需要。
技术实现思路
本专利技术的主要目的在于提供一种地址标准化方法和装置,旨在解决现有通讯地址不规范或者不标准导致通讯地址处理精确度低,以及处理效率低下的问题。为实现上述目的,本专利技术提供的一种地址标准化方法,所述地址标准化方法包括:当获取到待标准化地址时,从所述待标准化地址中提取关键词;根据所述关键词划分所述待标准化地址,得到所述待标准化地址的地址分词;将所述地址分词与预设地址库进行对比,得到对比结果;根据所述对比结果补全所述待标准化地址,使所述待标准化地址转化成标准化地址。优选地,所述当获取到待标准化地址时,从所述待标准化地址中提取关键词的步骤之后,还包括:确定所述关键词的优先级;所述将所述地址分词与预设地址库进行对比,得到对比结果的步骤包括:根据所述关键词的优先级的高低确定所述地址分词的优先级高低;按照所述地址分词的优先级高低依次将所述地址分词与所述预设地址库进行对比,得到对比结果。优选地,所述根据所述关键词划分所述待标准化地址,得到所述待标准化地址的地址分词的步骤之后,还包括:解析所述地址分词,确定所述地址分词是否完全划分;若所述地址分词中存在未完全划分的地址分词,则根据预设补全规则补全所述未完全划分的地址分词,再次划分所述未完全划分的地址分词。优选地,所述当获取到待标准化地址时,从所述待标准化地址中提取关键词的步骤包括:当获取到待标准化地址时,对所述待标准化地址进行预处理,得到预处理后的待标准化地址;在所述预处理后的待标准化地址中提取所述待标准化地址的关键词。优选地,所述根据所述对比结果补全所述待标准化地址,使所述待标准化地址转化成标准化地址的步骤之后,还包括:对所述标准化地址进行分类,将属于同一类别的地址存储于同一个文件夹中。此外,为实现上述目的,本专利技术还提供一种地址标准化装置,所述地址标准化装置包括:提取模块,用于当获取到待标准化地址时,从所述待标准化地址中提取关键词;划分模块,用于根据所述关键词划分所述待标准化地址,得到所述待标准化地址的地址分词;对比模块,用于将所述地址分词与预设地址库进行对比,得到对比结果;补全模块,用于根据所述对比结果补全所述待标准化地址,使所述待标准化地址转化成标准化地址。优选地,所述地址标准化装置还包括:确定模块,用于确定所述关键词的优先级;所述对比模块包括:确定单元,用于根据所述关键词的优先级的高低确定所述地址分词的优先级高低;对比单元,用于按照所述地址分词的优先级高低依次将所述地址分词与所述预设地址库进行对比,得到对比结果。优选地,所述地址标准化装置还包括:解析模块,用于解析所述地址分词,确定所述地址分词是否完全划分;所述补全模块,还用于若所述地址分词中存在未完全划分的地址分词,则根据预设补全规则补全所述未完全划分的地址分词,再次划分所述未完全划分的地址分词。优选地,所述提取模块包括:预处理单元,用于当获取到待标准化地址时,对所述待标准化地址进行预处理,得到预处理后的待标准化地址;提取单元,用于在所述预处理后的待标准化地址中提取所述待标准化地址的关键词。优选地,所述地址标准化装置还包括:分类模块,用于对所述标准化地址进行分类,将属于同一类别的地址存储于同一个文件夹中。本专利技术通过当获取到待标准化地址时,根据所述待标准化地址中的关键词划分所述待标准化地址,以得到所述待标准化地址的地址分词,并将所述地址分词与预设地址库进行对比,根据对比结果补全所述待标准化地址,以得到标准化地址。实现了将由于用户书写习惯或者某些地区存在同名等现象所导致的通讯地址不规范或者不标准的地址转化为标准化形式的地址,提高了通讯地址处理的精确度和通讯地址处理的效率。附图说明图1为本专利技术地址标准化方法的第一实施例的流程示意图;图2为本专利技术地址标准化方法的第二实施例的流程示意图;图3为本专利技术地址标准化方法的第三实施例的流程示意图;图4为本专利技术地址标准化装置的第一实施例的功能模块示意图;图5为本专利技术地址标准化装置的第二实施例的功能模块示意图;图6为本专利技术实施例中对比模块的一种功能模块示意图;图7为本专利技术地址标准化装置的第三实施例的功能模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提供一种地址标准化方法。参照图1,图1为本专利技术地址标准化方法第一实施例的流程示意图。在本实施例中,所述地址标准化方法包括:步骤S10,当获取到待标准化地址时,从所述待标准化地址中提取关键词;当获取到待标准化的地址时,解析所述待标准化地址,从所述待标准化地址中提取关键词。需要说明的是,所述关键词为所述待标准化地址中具有代表性的词,包括省级关键词、地区级关键词、县级关键词、乡级关键词、村级关键词、街巷名关键词、住宅小区关键词、门楼地址关键词和兴趣点关键词。其中,所述省级关键词包括但不限于市(直辖市)、省、市(省会)、自治区和特别行政区;所述地区级关键词包括但不限于地区、盟、自治州和(地级)市;所述县级关键词包括但不限于县、自治州、旗、自治旗和(市辖)区;所述乡级关键词包括但不限于乡、镇和街道办;所述村级关键词包括但不限于村、庄、屯和里;所述街巷名关键词包括但不限于路、大道、道、大街、街、巷、胡同、条和里;所述住宅小区关键词包括但不限于区、园、村、坊、庄、居、寓、苑、小区、弄和公寓;所述门楼地址关键词包括但不限于号、号楼、楼、宿舍、斋、馆和堂;所述兴趣点关键词包括但不限于大厦、广场、饭店、中心、大楼、楼、场、广场、馆、酒店、局和城。如当所获取待标准化地址为“河北唐山市路北区丽景逸翠园1号楼202室”,则解析所述待表标准化地址,得到的关键词为“市、区、园、楼和室”。步骤S20,根据所述关键词划分所述待标准化地址,得到所述待标准化地址的地址分词;当得到所述待标准化地址的关键词时,根据所述关键词划分所述待标准化地址,得到所述待标准化地址的地址分词。当得到所述待标准化地址“河北唐山市路北本文档来自技高网...

【技术保护点】
一种地址标准化方法,其特征在于,所述地址标准化方法包括:当获取到待标准化地址时,从所述待标准化地址中提取关键词;根据所述关键词划分所述待标准化地址,得到所述待标准化地址的地址分词;将所述地址分词与预设地址库进行对比,得到对比结果;根据所述对比结果补全所述待标准化地址,使所述待标准化地址转化成标准化地址。

【技术特征摘要】
1.一种地址标准化方法,其特征在于,所述地址标准化方法包括:当获取到待标准化地址时,从所述待标准化地址中提取关键词;根据所述关键词划分所述待标准化地址,得到所述待标准化地址的地址分词;将所述地址分词与预设地址库进行对比,得到对比结果;根据所述对比结果补全所述待标准化地址,使所述待标准化地址转化成标准化地址。2.如权利要求1所述的地址标准化方法,其特征在于,所述当获取到待标准化地址时,从所述待标准化地址中提取关键词的步骤之后,还包括:确定所述关键词的优先级;所述将所述地址分词与预设地址库进行对比,得到对比结果的步骤包括:根据所述关键词的优先级的高低确定所述地址分词的优先级高低;按照所述地址分词的优先级高低依次将所述地址分词与所述预设地址库进行对比,得到对比结果。3.如权利要求1所述的地址标准化方法,其特征在于,所述根据所述关键词划分所述待标准化地址,得到所述待标准化地址的地址分词的步骤之后,还包括:解析所述地址分词,确定所述地址分词是否完全划分;若所述地址分词中存在未完全划分的地址分词,则根据预设补全规则补全所述未完全划分的地址分词,再次划分所述未完全划分的地址分词。4.如权利要求1所述的地址标准化方法,其特征在于,所述当获取到待标准化地址时,从所述待标准化地址中提取关键词的步骤包括:当获取到待标准化地址时,对所述待标准化地址进行预处理,得到预处理后的待标准化地址;在所述预处理后的待标准化地址中提取所述待标准化地址的关键词。5.如权利要求1至4任一项所述的地址标准化方法,其特征在于,所述根据所述对比结果补全所述待标准化地址,使所述待标准化地址转化成标准化地址的步骤之后,还包括:对所述标准化地...

【专利技术属性】
技术研发人员:张锐
申请(专利权)人:深圳市永兴元科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1