一种离线地理编码非结构化地址解析系统技术方案

技术编号:17939712 阅读:28 留言:0更新日期:2018-05-15 20:07
本发明专利技术提供了一种离线地理编码非结构化地址解析系统,其特征在于,包括:本地POI坐标库建立模块;非结构化地址地理编码解析模块;关联交通对象模块。本发明专利技术的优点是:利用本地数据库的地址坐标进行离线地理编码可不依赖于互联网远程接口,速度较快,且支持对非结构化地址的地理编码地址解析,适用于大批量非结构化地址解析。解析后的地理位置点关联交通对象,以坐标点与交通对象的联合描述方式为后期数据挖掘分析奠定了基础。

An off-line geocoding unstructured address resolution system

The invention provides an off-line geo coding unstructured address resolution system, which is characterized by the establishment of a local POI coordinate library module, an unstructured address geo coding parsing module, and an associated traffic object module. The advantage of this invention is that the off-line geo coding using the address coordinates of the local database can not rely on the Internet remote interface, and the speed is fast, and it supports the analysis of the geo coded address of unstructured addresses, and is suitable for large batch unstructured address parsing. After analyzing the geographical location points associated with the traffic objects, the joint description of the coordinate points and traffic objects laid the foundation for later data mining and analysis.

【技术实现步骤摘要】
一种离线地理编码非结构化地址解析系统
本专利技术涉及一种利用本地数据库存储的地址坐标,对非结构化地址信息进行地理编码,转换出地址信息对应的经度纬度信息,结合地图图层中各交通对象的经纬度信息,将地址信息关联到相关交通对象的系统,适用于交通信息及地理分析服务行业,属于地理编码地址解析

技术介绍
地理位置坐标信息是对地理空间信息进行具体分析统计挖掘的基础。人们日常生活中使用频繁的都是非结构化的地址信息,而任何技术应用的衍生发展都需要以精确地地理位置坐标信息为依据。为了提供准确的地理坐标,必须对非结构化的地址信息进行解析关联,从而为后续分析挖掘打下良好的基础。传统的地理编码解析是通过HTTP/HTTPS协议访问远程服务的接口,将结构化地址转换为经纬度。主要是将地理位置信息提交至各在线地图服务来获取经纬度坐标点。其中结构化地址是指内含国家、省份、城市、区县、城镇、乡村、街道、门牌号码、屋邨、大厦等建筑物名称,按照由大区域名称到小区域名称组合在一起的字符,且有效的地址是独一无二的。而实际中人们上报的地址信息往往无法做到标准的结构化,并带有不定量错别字。通常都是非常主观化的描述。这使得传统的地理编码解析存在许多不足:(1)非结构化地址进行语义识别时错误率高;(2)各在线地图POI地址库坐标不全,使得地理编码转换准确率低;(3)各在线地图坐标系不同,转换后的经纬度坐标点不能统一使用;(4)必须在有互联网的环境中才可以进行地理编码转换;(5)通过HTTP/HTTPS协议访问远程服务的接口速度慢;(6)各在线地图远程服务每日有访问量限制,不适用于大批量地理编码;(7)各在线地图不提供关联交通对象功能。
技术实现思路
本专利技术目的是提供一种不依赖于互联网远程接口的地理编码非结构化地址解析系统,对大批量非结构化地址进行解析关联交通对象。为了达到上述目的,本专利技术的技术方案是提供了一种离线地理编码非结构化地址解析系统,其特征在于,包括:本地POI坐标库建立模块,通过各在线地图的远程服务接口收集各类POI位置坐标点,将不同的坐标系转换成统一的WGS84坐标,录入本地坐标库中;非结构化地址地理编码解析模块,将非结构化地址按精准度逐一分解匹配本地坐标库中WGS84坐标点,进行地址解析,获得非结构化地址信息的经纬度坐标,包括高架与地面道路交叉口类匹配单元、地铁站出入口类匹配单元、道路交叉口类匹配单元、门牌号匹配单元及兴趣点类匹配单元,其中:高架与地面道路交叉口类匹配单元,用于判断当前非结构化地址中是否包含高架道路名称,若包含高架道路名称,则判断当前非结构化地址中是否包含本地坐标库中与该条高架道路有交叉口的地面道路名称,若包含该地面道路名称,则匹配上WGS84坐标,若不包含高架道路名称或包含高架道路名称但不包含与该高架道路相交的任一地面道路名称,则使能地铁站出入口类匹配单元;地铁站出入口类匹配单元,用于判断当前非结构化地址中是否包含轨交线路及地铁站名关键字,若包含轨交线路及地铁站名关键字,则判断是否包含出入口信息,若包含出入口信息,则匹配本地坐标库中的WGS84坐标,若不包含出入口信息,则将非结构化地址与本地坐标库中首个出入口坐标点的WGS84坐标相匹配。若不包含轨交线路或地铁站名关键字,则使能道路交叉口类匹配单元;道路交叉口类匹配单元,用于判断非结构化地址中是否含有道路交叉口库中的任意两条或两条以上路名,若包含,则优先匹配非结构化地址描述中先出现的两个路名交叉口,若不包含,则使能门牌号匹配单元;门牌号匹配单元,先判断非结构化地址中是否包含道路名,若包含,再判断是否包含该路名对应的任一门牌号或10以内相临近门牌号,若包含,则匹配本地坐标库中的WGS84坐标,若不包含道路名或者包含道路名不包含该路名对应的任一门牌号及相近门牌号,则使能兴趣点类匹配单元;兴趣点类匹配单元,首先判断是否包含该兴趣点名称,若包含,则判断该兴趣点所在道路名称是否与本地坐标库中的一致,若一致则,匹配本地坐标库中的WGS84坐标,若不包含兴趣点名称或包含兴趣点名称但所在道路名称与库中不一致,则不匹配;关联交通对象模块,用于将匹配到经纬度坐标的非结构化地址信息关联到相关交通对象。优选地,所述本地POI坐标库建立模块包括坐标获取单元、坐标转换单元及坐标分类,其中:坐标获取单元,通过各在线地图的HTTP/HTTPS协议访问远程服务的接口进行信息收集;坐标转换单元,从坐标获取单元收集到的信息中提取经纬度坐标,并将提取后的经纬度坐标通过各在线地图的加密方式进行相应的解密转换成W6S84坐标;坐标分类,按照优先级规则对坐标转换单元获取的WGS84统一坐标按照地理信息进行类型分类,将分类后的WGS84坐标分别录入本地坐标库中的LOCATION_ROAD_CROSS、LOCATION_HIGHWAY_CROSS、LOCATION_RAILWAY_STATION、LOCATION_HOUSE_NUMBER、LOCATION_POI坐标库表中,LOCATION_ROAD_CROSS坐标库表对应地面道路交叉口类别,LOCATION_HIGHWAY_CROSS坐标库表对应高架与地面道路交叉口类,LOCATION_RAILWAY_STATION坐标库表对应地铁站出入口类,LOCATION_HOUSE_NUMBER坐标库表对应门牌号类别,LOCATION_POI坐标库表对应兴趣点类别。优选地,所述WGS84坐标录入本地坐标库的同时,在每类坐标库表中加入字段FDT_CREATE_TIME和FDT_UPDATE_TIME,字段FDT_CREATE_TIME和FDT_UPDATE_TIME分别为当前WGS84坐标创建时间以及最近更新时间,通过这两个字段实现各个坐标的版本控制。优选地,所述交通对象分为道路交叉口及路段,路段是指交通网络上相邻两个节点之间的交通线路,所述关联交通对象模块首先进行道路交叉口关联:通过计算两点之间的距离,找到非结构化地址信息坐标100米范围内的所有道路交叉口,并取距离最近的一个交叉口作为该点关联的交通对象;若100米范围内不存在道路交叉口,则进行路段关联:通过计算点到直线的距离,找到非结构化地址信息坐标100米范围内的所有路段,并取距离最近的一个路段作为该点关联的交通对象。本专利技术的优点是:利用本地数据库的地址坐标进行离线地理编码可不依赖于互联网远程接口,速度较快,且支持对非结构化地址的地理编码地址解析,适用于大批量非结构化地址解析。解析后的地理位置点关联交通对象,以坐标点与交通对象的联合描述方式为后期数据挖掘分析奠定了基础。附图说明图1为离线地理编码非结构化地址解析整体模块框架图;图2为本地POI坐标库建立模块;图3为非结构化地址地理编码解析模块总流程图;图4为高架与地面道路交叉口类地址解析流程图图5为地铁站类地址解析流程图;图6为地面道路交叉口类地址解析流程图;图7为门牌号类地址解析流程图;图8为兴趣点类地址解析流程图;图9为地理位置坐标点关联交通对象模块。具体实施方式为使本专利技术更显易懂,下面结合附图对本专利技术的实施例作详细说明:本实施例在本专利技术技术方案下进行实施,给出了本专利技术的实施过程和实施效果。本专利技术的保护范围不限于下述的实施例。本专利技术的总体思路是:本地统一坐标本文档来自技高网
...
一种离线地理编码非结构化地址解析系统

【技术保护点】
一种离线地理编码非结构化地址解析系统,其特征在于,包括:本地POI坐标库建立模块,通过各在线地图的远程服务接口收集各类POI位置坐标点,将不同的坐标系转换成统一的WGS84坐标,录入本地坐标库中;非结构化地址地理编码解析模块,将非结构化地址按精准度逐一分解匹配本地坐标库中WGS84坐标点,进行地址解析,获得非结构化地址信息的经纬度坐标,包括高架与地面道路交叉口类匹配单元、地铁站出入口类匹配单元、道路交叉口类匹配单元、门牌号匹配单元及兴趣点类匹配单元,其中:高架与地面道路交叉口类匹配单元,用于判断当前非结构化地址中是否包含高架道路名称,若包含高架道路名称,则判断当前非结构化地址中是否包含本地坐标库中与该条高架道路有交叉口的地面道路名称,若包含该地面道路名称,则匹配上WGS84坐标,若不包含高架道路名称或包含高架道路名称但不包含与该高架道路相交的任一地面道路名称,则使能地铁站出入口类匹配单元;地铁站出入口类匹配单元,用于判断当前非结构化地址中是否包含轨交线路及地铁站名关键字,若包含轨交线路及地铁站名关键字,则判断是否包含出入口信息,若包含出入口信息,则匹配本地坐标库中的WGS84坐标,若不包含出入口信息,则将非结构化地址与本地坐标库中首个出入口坐标点的WGS84坐标相匹配。若不包含轨交线路或地铁站名关键字,则使能道路交叉口类匹配单元;道路交叉口类匹配单元,用于判断非结构化地址中是否含有道路交叉口库中的任意两条或两条以上路名,若包含,则优先匹配非结构化地址描述中先出现的两个路名交叉口,若不包含,则使能门牌号匹配单元;门牌号匹配单元,先判断非结构化地址中是否包含道路名,若包含,再判断是否包含该路名对应的任一门牌号或10以内相临近门牌号,若包含,则匹配本地坐标库中的WGS84坐标,若不包含道路名或者包含道路名不包含该路名对应的任一门牌号及相近门牌号,则使能兴趣点类匹配单元;兴趣点类匹配单元,首先判断是否包含该兴趣点名称,若包含,则判断该兴趣点所在道路名称是否与本地坐标库中的一致,若一致则,匹配本地坐标库中的WGS84坐标,若不包含兴趣点名称或包含兴趣点名称但所在道路名称与库中不一致,则不匹配;关联交通对象模块,用于将匹配到经纬度坐标的非结构化地址信息关联到相关交通对象。...

【技术特征摘要】
1.一种离线地理编码非结构化地址解析系统,其特征在于,包括:本地POI坐标库建立模块,通过各在线地图的远程服务接口收集各类POI位置坐标点,将不同的坐标系转换成统一的WGS84坐标,录入本地坐标库中;非结构化地址地理编码解析模块,将非结构化地址按精准度逐一分解匹配本地坐标库中WGS84坐标点,进行地址解析,获得非结构化地址信息的经纬度坐标,包括高架与地面道路交叉口类匹配单元、地铁站出入口类匹配单元、道路交叉口类匹配单元、门牌号匹配单元及兴趣点类匹配单元,其中:高架与地面道路交叉口类匹配单元,用于判断当前非结构化地址中是否包含高架道路名称,若包含高架道路名称,则判断当前非结构化地址中是否包含本地坐标库中与该条高架道路有交叉口的地面道路名称,若包含该地面道路名称,则匹配上WGS84坐标,若不包含高架道路名称或包含高架道路名称但不包含与该高架道路相交的任一地面道路名称,则使能地铁站出入口类匹配单元;地铁站出入口类匹配单元,用于判断当前非结构化地址中是否包含轨交线路及地铁站名关键字,若包含轨交线路及地铁站名关键字,则判断是否包含出入口信息,若包含出入口信息,则匹配本地坐标库中的WGS84坐标,若不包含出入口信息,则将非结构化地址与本地坐标库中首个出入口坐标点的WGS84坐标相匹配。若不包含轨交线路或地铁站名关键字,则使能道路交叉口类匹配单元;道路交叉口类匹配单元,用于判断非结构化地址中是否含有道路交叉口库中的任意两条或两条以上路名,若包含,则优先匹配非结构化地址描述中先出现的两个路名交叉口,若不包含,则使能门牌号匹配单元;门牌号匹配单元,先判断非结构化地址中是否包含道路名,若包含,再判断是否包含该路名对应的任一门牌号或10以内相临近门牌号,若包含,则匹配本地坐标库中的WGS84坐标,若不包含道路名或者包含道路名不包含该路名对应的任一门牌号及相近门牌号,则使能兴趣点类匹配单元;兴趣点类匹配单元,首先判断是否包含该兴趣点名称,若包含,则判断该兴趣点所在道路名称是否与本地坐标库中的一致,若一致则,匹配本地坐标库中的WGS84坐标,若不包含兴趣点名称或包含兴趣点名称但所在道路名称与库中不一致,则不匹配;关联交通对象模块,用于将匹配到经纬度坐标的非结构化地址信息关联到相关交通对象。2.如权...

【专利技术属性】
技术研发人员:陈平吴超腾沈丹凤苏贵民崔鑫王天瑞
申请(专利权)人:上海电科智能系统股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1