一种地名地址快速定位与查询的方法技术

技术编号:15938886 阅读:43 留言:0更新日期:2017-08-04 21:45
本发明专利技术涉及一种地名地址快速定位与查询的方法,包括以下步骤:(1)建立数据成果库;(2)将数据成果库建成地名地址检索库:首先对数据成果库进行构建地址树,再将地址树与地名检索服务建立连接;(3)将地名地址检索库构建成标准地名地址检索服务平台:将地名地址检索库通过服务总线构建成标准地名地址检索服务平台;其中地名地址检索库的检索引擎提供多种接口供用户查询,所述接口包括地址正向匹配、地址逆向匹配、地址简单检索、地址列表查询、行政区划查询、楼盘表查询和地址详情查询;(4)在标准地名地址检索服务平台中输入需查询或需定位的地址,标准地名地址检索服务平台通过REST服务接口对外提供查询检索服务。

Method for fast location and inquiry of place name address

The invention relates to a method for locating the address and query, which comprises the following steps: (1) the establishment of data base; (2) the data base built the address retrieval library: first on the data base of constructing address tree, then the tree address and place names retrieval service connection (3); the address retrieval library constructed standard address search service platform: the address retrieval library through the service bus built into the standard address search service platform; wherein the address retrieval search engine offers a variety of interfaces for users to query, the interface includes address matching, address matching, simple retrieval, reverse address address list query, query, real estate administrative division table query and address details; (4) search service platform in the input to the query or the need to locate in the standard address The standard geographical name address retrieval service platform provides query retrieval services through the REST service interface.

【技术实现步骤摘要】
一种地名地址快速定位与查询的方法
本专利技术涉及数据处理
,尤其涉及一种地名地址快速定位与查询的方法。
技术介绍
随着中国经济的高速稳定的发展,随着城市化进程的加快,以及市区建设力度的加大,目前的地名变化很大,目前每年的新生地名大约在2万条以上,而有的地名命名很不规范,如包含生僻字、异体字等,或存在名不符实的现象,特别是有的建筑物、道路等还存在长期未命名的情况,这样在管理上存在很多困扰,无法做到有效的管理,同时不利于用户查询。地名地址数据是最常用的社会公共信息资源,与大众的日常生活紧密相关,同时,地名地址信息也是政府基础行政管理的基础资源。将地名地址信息提取并标准化,使其转化为地理信息服务的基础成果,为大众的生产生活提供支撑,已成为一项迫切的需要。现有的地理位置信息挖掘算法主要是利用关键字匹配的方法,由于在互联网环境下文本中的地名地址信息存在描述错误、不准确、同音字、不够标准等问题,所以基于关键字匹配的位置信息挖据算法准确率较低,不足以满足各行各业对地理信息的要求。现有的地名查询面向公众服务要求结果的广度(尽可能多的返回),地址节类型不限定;面向行业应用要求结果的精度(一个或无),地址节类型限定;检索服务核心SDK(分词、解析、比对、查询)及其对外检索服务的分离;地名地址库的构建效率,检索服务的响应效率;因此,现在有必要开发一种能够快速查询和定位的地名地址快速定位与查询的方法。
技术实现思路
本专利技术要解决的技术问题是,提供一种能够自动纠错、对于模糊地名搜索智能化程度高地名地址快速定位与查询的方法。为了解决上述技术问题,本专利技术采用的技术方案是:该地名地址快速定位与查询的方法,包括以下步骤:(1)建立数据成果库:将标注的基础地名地址样本数据库的数据进行数据比对并整合分析,得到数据成果并建立数据成果库;(2)将数据成果库建成地名地址检索库:首先对数据成果库进行构建地址树,再将地址树与地名检索服务建立连接,从而形成地名地址检索库;(3)将地名地址检索库构建成标准地名地址检索服务平台:将地名地址检索库通过服务总线构建成标准地名地址检索服务平台;其中地名地址检索库的检索引擎提供至少一种接口供用户查询,所述接口包括地址正向匹配、地址逆向匹配、地址简单检索、地址列表查询、行政区划查询、楼盘表查询和地址详情查询;(4)在标准地名地址检索服务平台中输入需查询或需定位的地址,标准地名地址检索服务平台通过REST服务接口对外提供查询检索服务。采用上述技术方案,通过标准库建立模型将各个标注的基础地名地址样本数据库的数据进行比对整合,通过对城市地址门楼牌号进行分析归纳、拆分处理和统一编码,使空间信息后形成的通用地址空间数据库数据规范,包括制定规范的标准依据、地址模型、地址信息数据项构成、地址编码规则、地址数据库建库方法等内容;这整个过程由建库系统自动完成,然后在该数据成果库的基础上搭建检索服务平台,这样即能快速的完成数据成果库的建立,又能节省人力物力;同时实现了地名地址的快速定位与查询;此外,统一标准地名地址规范模型,在经典有限状态机理论的基础上,通过“地址层级-地址表-地址节”,实现兼顾地名地址空间语义的拓扑关系及地名地址节文本序列的地址路径模型,尤其便于表达多路径同一空间语义的地名地址。本专利技术进一步改进在于,所述步骤(1)中数据成果建立数据成果库的步骤是:先将数据成果批量处理输入预处理库,再对预处理库的数据进行审核入库后构建成数据成果库。本专利技术进一步改进在于,所述标注的基础地名地址样本数据包括:住建数据、国土数据、公安数据、民政数据和基础地理信息数据;所述数据整合的步骤是:1)将基础地理信息数据输入数据成果库;2)对住建数据进行预处理,将住建数据中的规则数据和不规则数据进行分类,规则数据则直接输入数据成果库;不规则的数据则与国土数据和公安数据一起进行匹配数据后输入数据成果库。本专利技术进一步改进在于,所述数据成果包括MongoDB数据库和Oracle数据库;所述MongoDB数据库为统一标准地名地址库,所述Oracle数据库包括地名地址提交库、地名地址发布库、地名地址预处理库和地名地址成果库。本专利技术进一步改进在于,服务总线包括地名地址检索服务、地名分词服务、反向地址匹配服务和数据比对服务。本专利技术进一步改进在于,所述步骤(1)中的对基础地名地址样本数据库的数据进行比对的步骤包括:A)第一轮比对导入表:将原始数据表按照比对表的格式导入比对表中,然后查询服务(Query)比对,将各地址节利用查询服务,进行比对,如果比对成果则将比对效果设置为1,否则设置成0;B)第一轮未匹配分析:针对第一轮未匹配分析的分析未匹配的原因,并整理,然后使用解析服务方案进行比对;C)第二轮地址节拼接成地址全称:先将各地址节拼接成地址全称,然后进行解析服务(Resolve)比对,针对地址全称进行解析和比对,比对成果,则比对效果设置为1,否则设置为0;D)第二轮未匹配分析:针对第二轮未匹配分析的分析未匹配的原因,并提出解决策略;针对问题进行修改,再次进行解析服务(Resolve)比对,针对解析比对结果进行分析,对未匹配的数据进行分析后继续循环上述步骤。本专利技术进一步改进在于,所述步骤(1)中的对基础地名地址样本数据库的数据进行比对采用的是地名地址分词算法和地名地址解析算法;地名地址分词算法采用综合地名地址辞典(Gazetteer)与地名地址关键词的方法;地名地址解析算法在分词的基础上,通过地址路径搜索与地址节文本冗余相结合的方法。地名地址分词算法采用综合地名地址辞典(Gazetteer)与地名地址关键词的方法实现精确识别与模糊匹配的平衡;地名地址解析算法在分词的基础上,通过地址路径搜索与地址节文本冗余相结合的方法,实现面向行业应用与面向公众服务的不同检索服务应用场景。本专利技术的进一步改进在于,该地名地址快速定位与查询系统包括GPS定位模块、存储模块、网络模块、无线模块和电源模块;所述无线模块包括蓝牙模块与WIFI模块,所述GPS定位模块、存储模块、网络模块、无线模块和电源模块均与控制模块相连接;所述GPS定位模块用于所处位置定位捕捉,所述存储模块用于信息的存储,所述网络模块用于网络连接,所述无线模块用于与外部设备无线连接,所述电源模块用于提供地名地址快速定位与查询系统的电源。与现有技术相比,本专利技术具有的有益效果是:1)地名匹配命中率高;2)自动纠错,对于模糊地名搜索智能化程度高;3)检索服务提供多种查询方式,例如正向地址查询、分类查询、普通查询、逆向查询、园查询等多维度查询方式;4)基于SOA系统架构,以ESB消息总线进行集成,通过REST服务接口对外提供服务,架构轻盈灵活,扩展性强。附图说明下面结合附图进一步描述本专利技术的技术方案:图1是本专利技术的地名地址快速定位与查询的方法的数据构建图;图2是本专利技术的地名地址快速定位与查询的方法的检索实现的方式图;图3是本专利技术的地名地址快速定位与查询的系统的结构图。具体实施方式为了加深对本专利技术的理解,下面将结合附图和实施例对本专利技术做进一步详细描述,该实施例仅用于解释本专利技术,并不对本专利技术的保护范围构成限定。实施例:该地名地址快速定位与查询的方法,包括以下步骤:(1)建立数据成果库:将标注的基础地名地址样本数据库的数据进行数本文档来自技高网...
一种地名地址快速定位与查询的方法

【技术保护点】
一种地名地址快速定位与查询的方法,其特征在于,包括以下步骤:(1)建立数据成果库:将标注的基础地名地址样本数据库的数据进行数据比对并整合分析,得到数据成果并建立数据成果库;(2)将数据成果库建成地名地址检索库:首先对数据成果库进行构建地址树,再将地址树与地名检索服务建立连接,从而形成地名地址检索库;(3)将地名地址检索库构建成标准地名地址检索服务平台:将地名地址检索库通过服务总线构建成标准地名地址检索服务平台;其中地名地址检索库的检索引擎提供至少一种接口供用户查询,所述接口包括地址正向匹配、地址逆向匹配、地址简单检索、地址列表查询、行政区划查询、楼盘表查询和地址详情查询;(4)在标准地名地址检索服务平台中输入需查询或需定位的地址,标准地名地址检索服务平台通过REST服务接口对外提供查询检索服务。

【技术特征摘要】
1.一种地名地址快速定位与查询的方法,其特征在于,包括以下步骤:(1)建立数据成果库:将标注的基础地名地址样本数据库的数据进行数据比对并整合分析,得到数据成果并建立数据成果库;(2)将数据成果库建成地名地址检索库:首先对数据成果库进行构建地址树,再将地址树与地名检索服务建立连接,从而形成地名地址检索库;(3)将地名地址检索库构建成标准地名地址检索服务平台:将地名地址检索库通过服务总线构建成标准地名地址检索服务平台;其中地名地址检索库的检索引擎提供至少一种接口供用户查询,所述接口包括地址正向匹配、地址逆向匹配、地址简单检索、地址列表查询、行政区划查询、楼盘表查询和地址详情查询;(4)在标准地名地址检索服务平台中输入需查询或需定位的地址,标准地名地址检索服务平台通过REST服务接口对外提供查询检索服务。2.根据权利要求1所述的地名地址快速定位与查询的方法,其特征在于,所述步骤(1)中数据成果建立数据成果库的步骤是:先将数据成果批量处理输入预处理库,再对预处理库的数据进行审核入库后构建成数据成果库。3.根据权利要求1所述的地名地址快速定位与查询的方法,其特征在于,所述标注的基础地名地址样本数据包括:住建数据、国土数据、公安数据、民政数据和基础地理信息数据;整合分析的步骤是:1)将基础地理信息数据输入数据成果库;2)对住建数据进行预处理,将住建数据中的规则数据和不规则数据进行分类,规则数据则直接输入数据成果库;不规则的数据则与国土数据和公安数据一起进行匹配数据后输入数据成果库。4.根据权利要求2或3所述的地名地址快速定位与查询的方法,其特征在于,所述数据成果包括MongoDB数据库和Oracle数据库;所述MongoDB数据库为统一标准地名地址库,所述Oracle数据库包括地名地址提交库、地名地址发布库、地名地址预处理库和地名地址成果库。5.根据权利要求4所述的地名地址快速定位与查询的方法,其特征在于,服务总线包括...

【专利技术属性】
技术研发人员:王恒军徐忠建朱必亮李俊陈朴
申请(专利权)人:江苏速度信息科技股份有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1