基础地址库构建方法及系统技术方案

技术编号:15499984 阅读:57 留言:0更新日期:2017-06-03 22:03
本发明专利技术属于地址数据处理技术领域,具体涉及一种基础地址库构建方法及系统。本发明专利技术提供的基础地址库构建方法包括:步骤S1,将获取的地址数据拆分成多个地址要素,并标注所有地址要素的地址等级;步骤S2,根据所述地址要素的地址等级,将所述地址要素填入标准地址中;步骤S3,根据所述地址数据的地址编码,在统一编码库中关联匹配所述标准地址中空缺的部分,根据关联匹配结果补全所述标准地址,将补全后的标准地址存入基础地址库。本发明专利技术提供的基础地址库构建方法,利用不同机构的地址数据自动化的构建基础地址库,提高了基础地址库构建的效率和基础地址库的精准度。

Base address library construction method and system

The invention belongs to the technical field of address data processing, in particular to a method and a system for constructing a base address library. The invention provides a basis for constructing address database method comprises: step S1, will obtain the address data split into multiple address elements, and marked all the address element address level; step S2, according to the address elements of the address class, the address element in standard address; step S3, according to the encoding. The address data, in a unified encoding Library Association matches the standard address in the vacant part, according to the correlation matching results of the standard complete address, the address stored in the base after the completion of the standard library. The basic address library construction method provided by the invention utilizes the address data of different institutions to automatically build the base address library, thereby improving the efficiency of the construction of the base address library and the accuracy of the base address library.

【技术实现步骤摘要】
基础地址库构建方法及系统
本专利技术涉及地址数据处理
,具体涉及一种基础地址库构建方法及系统。
技术介绍
基础地址库主要是为了实现保存、修改、完善地址要素和转化地址信息功能的基础库。目前绝大多数数据系统中都保存着地址信息,不同的机构根据自身的需要对这些数据进行采集存储、管理。但是,由于机构间协作水平的限制,不同机构的业务系统并没有经过顶层设计和统筹规划,导致地址体系异常复杂,如地址结构无序,地名命名复杂,缺乏规律性,街道门牌号混乱,缺乏统一的标准等,使得很多地址信息都没有得到充分利用,对地址信息的应用和共享产生了障碍。这种情况下,就需要地址标准化技术,可以将不同机构的数据进行整合,构造地址数据的主要数据库,实现不同机构的数据共享。但现有的构建基础地址库的方法,通常需要人工进行,耗时耗力,数据来源多,数据梳理难度高。
技术实现思路
针对现有技术中的缺陷,本专利技术提供的基础地址库构建方法及系统,利用不同机构的地址数据自动化的构建基础地址库,提高了基础地址库构建的效率和基础地址库的精准度。第一方面,本专利技术提供的基础地址库构建方法,包括:步骤S1,将获取的地址数据拆分成多个地址要素,并标注所有地址要素的地址等级;步骤S2,根据所述地址要素的地址等级,将所述地址要素填入标准地址中;步骤S3,根据所述地址数据的地址编码,在统一编码库中关联匹配所述标准地址中空缺的部分,根据关联匹配结果补全所述标准地址,将补全后的标准地址存入基础地址库。本专利技术提供的基础地址库构建方法,能够将格式不统一的地址数据转化为标准格式的地址,整合不同机构的地址数据,自动化的构建方式提高了基础地址库构建的效率和基础地址库的精准度。基础地址库有助于实现地址信息的共享,为其它基于地址信息的应用提供了可靠的保证。优选地,还包括:若拆分过程中存在异常,则进行异常处理,所述异常处理包括:若拆分后的字段中存在特殊字符,则将特殊字符替换为对应的标准字符后,再拆分所述字段得到地址要素,并标注地址要素的地址等级;若为路/路号数据异常,则根据所述地址数据的地址编码在统一编码库中获取正确的路或路号;若为楼栋/房间数据异常,则根据所述地址数据的地址编码在统一编码库中获取正确的楼号或房号。优选地,将所述特殊字符替换为对应的标准字符,包括:根据前一地址要素的地址等级,确定当前处理地址要素中的特殊字符对应的标准字符,将所述特殊字符替换为所述标准字符。优选地,还包括:若存在其它异常情况,则将所述地址数据存入异常地址数据表单,并发出人工查验的提醒。优选地,在步骤S1之前还包括:对同一地址的不同来源的地址数据,取优先级高的地址数据进行拆分,所述优先级根据地址数据的来源确定。优选地,还包括:在基础地址库中查找与所述地址数据的地址编码匹配的标准地址,根据补全后的标准地址更新基础地址库中的标准地址。第二方面,本专利技术提供的基础地址库构建系统,包括:地址拆分模块,用于将获取的地址数据拆分成多个地址要素,并标注所有地址要素的地址等级;地址标准化模块,用于根据所述地址要素的地址等级,将所述地址要素填入标准地址中;地址补全模块,用于根据所述地址数据的地址编码,在统一编码库中关联匹配所述标准地址中空缺的部分,根据关联匹配结果补全所述标准地址,将补全后的标准地址存入基础地址库。本专利技术提供的基础地址库构建系统,能够将格式不统一的地址数据转化为标准格式的地址,整合不同机构的地址数据,自动化的构建方式提高了基础地址库构建的效率和基础地址库的精准度。基础地址库有助于实现地址信息的共享,为其它基于地址信息的应用提供了可靠的保证。优选地,还包括异常处理模块,用于:若拆分过程中存在异常,则进行异常处理,所述异常处理包括:若拆分后的字段中存在特殊字符,则将特殊字符替换为对应的标准字符后,再拆分所述字段得到地址要素,并标注地址要素的地址等级;若为路/路号数据异常,则根据所述地址数据的地址编码在统一编码库中获取正确的路或路号;若为楼栋/房间数据异常,则根据所述地址数据的地址编码在统一编码库中获取正确的楼号或房号。优选地,所述地址拆分模块中,将所述特殊字符替换为对应的标准字符,包括:根据前一地址要素的地址等级,确定当前处理地址要素中的特殊字符对应的标准字符,将所述特殊字符替换为所述标准字符。优选地,还包括异常提醒模块,用于若存在其它异常情况,则将所述地址数据存入异常地址数据表单,并发出人工查验的提醒。优选地,还包括数据选取模块,用于对同一地址的不同来源的地址数据,取优先级高的地址数据进行拆分,所述优先级根据地址数据的来源确定。优选地,还包括地址更新模块,用于在基础地址库中查找与所述地址数据的地址编码匹配的标准地址,根据补全后的标准地址更新基础地址库中的标准地址。附图说明图1为本专利技术实施例所提供的一种基础地址库构建方法的流程图;图2为本专利技术实施例所提供的一种基础地址库构建系统的结构框图;图3为地址编码的一个示例。具体实施方式下面将结合附图对本专利技术技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,因此只是作为示例,而不能以此来限制本专利技术的保护范围。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本专利技术所属领域技术人员所理解的通常意义。如图1所示,本专利技术实施例提供的一种基础地址库构建方法,包括:步骤S1,将获取的地址数据拆分成多个地址要素,并标注所有地址要素的地址等级。其中,地址数据来源于各个机构,如:公安部门、房屋管理中心等。地址要素包含的数据主要有:省级行政区名、市级行政区名、县级行政区名、乡级行政区名、路名、路号、小区名、楼号、单元号、房间号等。地址等级是根据国家规定的行政等级进行划分的,地址等级的划分如表1所示:表1第一级省第二级市第三级区、县第四级镇、乡、街道第五级社区、行政村第六级路、巷第七级路号第八级小区、自然村、大厦第九级楼号第十级单元号、房号其中,地址拆分的方法有很多,比如,根据关键词进行拆分,关键词可以选用“省”、“市”、“路”等诸如此类表示行政等级的词。以拆分路名和小区名字为例,拆分方法可以是根据关键字区分,路名包含大道、巷、街等关键字,而小区名称包含自然村,XX大厦,XX花园等信息;拆分方法还可以结合路号或者楼号来区分是小区名或路名。地址拆分时按第一级到第十级的顺序进行拆分。步骤S2,根据地址要素的地址等级,将地址要素填入标准地址中。其中,标准地址按照标准的格式进行存储,标准地址根据地址等级划分为九个部分:省、市、区(县)、乡(镇、街道)、社区(行政村)、路(巷)、路号、小区(自然村、大厦)、楼号、单元号(房号)。根据给地址要素标注的地址等级,将切分得到的地址要素存入标准地址中的相应部分。由于地址数据拆分后不一定包含标准地址中的所有部分,对于缺失的部分,暂时不填,等待后续补全。步骤S3,根据地址数据的地址编码,在统一编码库中关联匹配标准地址中空缺的部分,根据关联匹配结果补全标准地址,将补全后的标准地址存入基础地址库。其中,每个采集到的地址数据都有带有一个地址编码,这个地址编码对应唯一的一个地址,是地址数据生成时就进行标注的。如图3所示,地址编码一共25位,依次为6位市辖区编码(省、市、区)、3位街道顺序码、3社区顺序码、2为空间基础网格顺序码、5本文档来自技高网...
基础地址库构建方法及系统

【技术保护点】
一种基础地址库构建方法,其特征在于,包括:步骤S1,将获取的地址数据拆分成多个地址要素,并标注所有地址要素的地址等级;步骤S2,根据所述地址要素的地址等级,将所述地址要素填入标准地址中;步骤S3,根据所述地址数据的地址编码,在统一编码库中关联匹配所述标准地址中空缺的部分,根据关联匹配结果补全所述标准地址,将补全后的标准地址存入基础地址库。

【技术特征摘要】
1.一种基础地址库构建方法,其特征在于,包括:步骤S1,将获取的地址数据拆分成多个地址要素,并标注所有地址要素的地址等级;步骤S2,根据所述地址要素的地址等级,将所述地址要素填入标准地址中;步骤S3,根据所述地址数据的地址编码,在统一编码库中关联匹配所述标准地址中空缺的部分,根据关联匹配结果补全所述标准地址,将补全后的标准地址存入基础地址库。2.根据权利要求1所述的方法,其特征在于,还包括:若拆分过程中存在异常,则进行异常处理,所述异常处理包括:若拆分后的字段中存在特殊字符,则将特殊字符替换为对应的标准字符后,再拆分所述字段得到地址要素,并标注地址要素的地址等级;若为路/路号数据异常,则根据所述地址数据的地址编码在统一编码库中获取正确的路或路号;若为楼栋/房间数据异常,则根据所述地址数据的地址编码在统一编码库中获取正确的楼号或房号。3.根据权利要求2所述的方法,其特征在于,将所述特殊字符替换为对应的标准字符,包括:根据前一地址要素的地址等级,确定当前处理地址要素中的特殊字符对应的标准字符,将所述特殊字符替换为所述标准字符。4.根据权利要求2所述的方法,其特征在于,还包括:若存在其它异常情况,则将所述地址数据存入异常地址数据表单,并发出人工查验的提醒。5.根据权利要求1所述的方法,其特征在于,在步骤S1之前还包括:对同一地址的不同来源的地址数据,取优先级高的地址数据进行拆分,所述优先级根据地址数据的来源确定。6.根据权利要求1所述的方法,其特征在...

【专利技术属性】
技术研发人员:张楠张闪何运昌陈伟群贾西贝
申请(专利权)人:深圳市华傲数据技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1