The invention belongs to the technical field of address data processing, in particular to a method and a system for constructing a base address library. The invention provides a basis for constructing address database method comprises: step S1, will obtain the address data split into multiple address elements, and marked all the address element address level; step S2, according to the address elements of the address class, the address element in standard address; step S3, according to the encoding. The address data, in a unified encoding Library Association matches the standard address in the vacant part, according to the correlation matching results of the standard complete address, the address stored in the base after the completion of the standard library. The basic address library construction method provided by the invention utilizes the address data of different institutions to automatically build the base address library, thereby improving the efficiency of the construction of the base address library and the accuracy of the base address library.
【技术实现步骤摘要】
基础地址库构建方法及系统
本专利技术涉及地址数据处理
,具体涉及一种基础地址库构建方法及系统。
技术介绍
基础地址库主要是为了实现保存、修改、完善地址要素和转化地址信息功能的基础库。目前绝大多数数据系统中都保存着地址信息,不同的机构根据自身的需要对这些数据进行采集存储、管理。但是,由于机构间协作水平的限制,不同机构的业务系统并没有经过顶层设计和统筹规划,导致地址体系异常复杂,如地址结构无序,地名命名复杂,缺乏规律性,街道门牌号混乱,缺乏统一的标准等,使得很多地址信息都没有得到充分利用,对地址信息的应用和共享产生了障碍。这种情况下,就需要地址标准化技术,可以将不同机构的数据进行整合,构造地址数据的主要数据库,实现不同机构的数据共享。但现有的构建基础地址库的方法,通常需要人工进行,耗时耗力,数据来源多,数据梳理难度高。
技术实现思路
针对现有技术中的缺陷,本专利技术提供的基础地址库构建方法及系统,利用不同机构的地址数据自动化的构建基础地址库,提高了基础地址库构建的效率和基础地址库的精准度。第一方面,本专利技术提供的基础地址库构建方法,包括:步骤S1,将获取的地址数据拆分成多个地址要素,并标注所有地址要素的地址等级;步骤S2,根据所述地址要素的地址等级,将所述地址要素填入标准地址中;步骤S3,根据所述地址数据的地址编码,在统一编码库中关联匹配所述标准地址中空缺的部分,根据关联匹配结果补全所述标准地址,将补全后的标准地址存入基础地址库。本专利技术提供的基础地址库构建方法,能够将格式不统一的地址数据转化为标准格式的地址,整合不同机构的地址数据,自动化的构建方式提高 ...
【技术保护点】
一种基础地址库构建方法,其特征在于,包括:步骤S1,将获取的地址数据拆分成多个地址要素,并标注所有地址要素的地址等级;步骤S2,根据所述地址要素的地址等级,将所述地址要素填入标准地址中;步骤S3,根据所述地址数据的地址编码,在统一编码库中关联匹配所述标准地址中空缺的部分,根据关联匹配结果补全所述标准地址,将补全后的标准地址存入基础地址库。
【技术特征摘要】
1.一种基础地址库构建方法,其特征在于,包括:步骤S1,将获取的地址数据拆分成多个地址要素,并标注所有地址要素的地址等级;步骤S2,根据所述地址要素的地址等级,将所述地址要素填入标准地址中;步骤S3,根据所述地址数据的地址编码,在统一编码库中关联匹配所述标准地址中空缺的部分,根据关联匹配结果补全所述标准地址,将补全后的标准地址存入基础地址库。2.根据权利要求1所述的方法,其特征在于,还包括:若拆分过程中存在异常,则进行异常处理,所述异常处理包括:若拆分后的字段中存在特殊字符,则将特殊字符替换为对应的标准字符后,再拆分所述字段得到地址要素,并标注地址要素的地址等级;若为路/路号数据异常,则根据所述地址数据的地址编码在统一编码库中获取正确的路或路号;若为楼栋/房间数据异常,则根据所述地址数据的地址编码在统一编码库中获取正确的楼号或房号。3.根据权利要求2所述的方法,其特征在于,将所述特殊字符替换为对应的标准字符,包括:根据前一地址要素的地址等级,确定当前处理地址要素中的特殊字符对应的标准字符,将所述特殊字符替换为所述标准字符。4.根据权利要求2所述的方法,其特征在于,还包括:若存在其它异常情况,则将所述地址数据存入异常地址数据表单,并发出人工查验的提醒。5.根据权利要求1所述的方法,其特征在于,在步骤S1之前还包括:对同一地址的不同来源的地址数据,取优先级高的地址数据进行拆分,所述优先级根据地址数据的来源确定。6.根据权利要求1所述的方法,其特征在...
【专利技术属性】
技术研发人员:张楠,张闪,何运昌,陈伟群,贾西贝,
申请(专利权)人:深圳市华傲数据技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。