当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于语义位置网的地址位置推测方法技术

技术编号:29526475 阅读:9 留言:0更新日期:2021-08-03 15:12
本发明专利技术提供了一种基于语义位置网的地址位置推测方法,主要步骤包括对地址库进行切分和聚类,构建语义位置网;根据待推测的地址位置,通过语义位置网获取其空间包围盒;在空间包围盒中选取8到20个点构成最优分布,从分布中得到方向、距离和角度这三种参数信息,结合最优分布中地址的空间坐标,通过数学计算得到待推测地址位置的坐标。本发明专利技术提供了一种流程简明,效率高,能够对地址库缺失地址进行定位以及提高地址定位精度,应用于数字城市以及智慧城市构建中地址位置推测方案。

【技术实现步骤摘要】
一种基于语义位置网的地址位置推测方法
本专利技术涉及一种地址位置推测方法,尤其涉及一种基于语义位置网的地址位置推测方法。
技术介绍
随着数字城市的快速发展,城市当中的各种数据都会进入到城市信息空间下面,根据位置对这些数据进行整合和共享是数字城市的终极目标。地址作为描述位置的数据形式,广泛存在于城市的各个部分,是一种非常适用于沟通城市不同领域数据的桥梁。今后,不论是在城市规划、行政管理、科学研究还是百姓生活等各领域,对地址空间定位的需求将会越来越广泛,对位置的精度要求也越来越高。提供准确的地址定位,成为数字城市以及智慧城市必须面对的问题。针对这个问题,目前的主要方法是采用地理编码技术,它作为地理信息系统(GIS)领域下的重要研究和应用领域,能够提供强大的解决方案。但是对于数字城市下各领域不同地址库中的地址,地址编码技术在地址位置定位时依然存在地址解析错误、地址匹配困难和缺乏地址位置推理能力的问题。针对地址位置定位中的前两个问题,国内外已经有很多相关的研究和专利,而对于地址位置推测,相关研究很少,本专利技术提出一种基于语义位置网的地址位置推测方法。本专利技术提出了一种对地址库中缺失地址进行定位、提高地址的定位精度的地址位置定位方法。语义位置网是在地址元素编码基础上,针对基础地址语义空间和地理位置空间关系映射进行管理的结构模型。语义位置网中语义关系、空间关系、节点关系等可以有效改变现有地址编码对地理空间和语义空间的一对一映射关系,为地址位置的推理提供更多参考信息。
技术实现思路
为了实现对地址库中缺失的地址进行定位和提高地址的定位精度,本专利技术以此为出发点,提出一种基于语义位置网的地址位置推测方法,其实现复杂度较低,可以在构建语义位置网的基础上实现地址位置的推理定位。方法步骤描述如下:一种基于语义位置网的地址位置推测方法,其特征在于:包括以下步骤:步骤1、对用来构建语义位置网的地址库中的地址进行预处理,具体是去除没有数字门牌号和字段重复的地址。处理后的地址库中地址的地址地段都唯一并且包含数字门牌号。步骤2、将步骤1中处理过的数据进行切分,构建语义位置网;步骤3、从语义位置网中获取待推测地址的空间包围盒;步骤4、从空间包围盒中获取最优分布;步骤5、从最优分布中提取方向、角度、距离这三种参数信息,结合最优分布中点集的空间坐标进行计算,得到待推测地址的空间坐标。在上述的一种基于语义位置网的地址位置推测方法,在步骤2中,需要将经过预处理的地址库中的地址进行切分,然后对切分结果进行聚类,根据聚类结果生成语义位置网初始层次结构,最后对初始层次结构中的问题进行修正,得到最终语义位置网,具体包括:步骤2.1:采用目前常用的基于规则与统计的方法对地址进行地址元素的解析和提取,完成对经过预处理的地址库中的地址的切分。步骤2.2:将切分后的地址根据地址字符串中相同位置字符串拼音首字母的ASCII码大小按照升序进行排列,排列后可以将地址库中相邻的地址放在序列当中邻接位置,通过计算邻接地址之间的相似度,将地址结构近似的地址放到同一个类,完成地址库聚类。步骤2.3:将每个类中的地址按照地址元素的等级构建语义位置网的初始层次结构,然后完成地址不完整修正和地址空间位置错误修正,形成最终的语义位置网结构。在上述的一种基于语义位置网的地址位置推测方法,在步骤3中,从步骤2获取的语义位置网中获取和待推测地址具有语义形似关系的位置单元集合,这些单元集合构成的空间范围代表了待推测地址的空间范围,这个范围即为所求空间包围盒,具体包括:步骤3.1:根据待预测地址的地址元素组成,从步骤2中获得的语义位置网中找到与待预测地址具有语义相近关系的位置单元。步骤3.2:根据位置单元所构成的地址集合的空间位置,得到待预测地址可能的空间范围。在上述的一种基于语义位置网的地址位置推测方法,在步骤4中,根据邻接距离和邻接语义位置最小原则,从包围盒中选取8到20个点,这些点集的空间分布称为最优分布。步骤4.1:在空间包围盒所包含的点集之中,根据点集数量确定要用来构成最优分布的点的数量n,n范围为8到20。步骤4.2:根据邻接距离和邻接语义距离的定义,从空间包围盒中确定n的点,分别能够使邻接距离最小和邻接语义距离最小,得到邻接距离最小对应的空间分布,邻接语义距离最小对应的空间分布。在上述的一种基于语义位置网的地址位置推测方法,在步骤5中,从最优分布中提取方向、角度和距离信息。步骤5.1:从最优分布中提取方向信息,同方向表示待预测点相对于基准线的偏转方向和基准点与前邻段线之间的偏转方向相同;反方向表示被预测点相对于基准线的偏转方向与基准点与其前邻段线之间的偏转方向相反,统计最优分布中点集所处方向的占比,待预测地址所采用的方向策略和占比大的方向一致。步骤5.2:从最优分布中提取角度信息,角度采用最优分布中所有点相对于其前邻段线之间偏转角度的统计平均值。步骤5.3:从最优分布中提取距离信息,距离采取从基准点到起点全部线段的欧式距离除以语义距离比值后的统计平均值。在上述的一种基于语义位置网的地址位置推测方法,在步骤5中,将最优分布中点集的空间坐标信息和获取的方向、角度和距离信息汇集在一起,完成地址推测的数学计算。步骤6.1:在最优分布中确定与待预测地址语义最为邻近的地址,得到其空间坐标(x1,y1)。步骤6.2:根据步骤5所获得的方向D,角度A,距离L信息。将空间坐标(x1,y1)沿基准线平移距离L,得到坐标(x2,y2)。步骤6.3:将坐标(x2,y2)沿着方向D旋转角度A,得到坐标(x3,y3),即为所求待预测地址的空间位置。因此,本专利技术具有如下优点:能有效地对未被包含在地址库中的地址进行有效的预测,解决现有的地址数据库虽然覆盖面广泛但仍存在地址数据缺失的问题。同时也能够用于提高地址定位精度,满足人们对高精度的定位服务的需求。附图说明图1是语义位置网构建流程示意图。图2是地址包围盒获取方法示意图。图3是从最优分布中获取方向、角度和距离示意图。图4是一种基于语义位置网的地址位置推测方法流程图。具体实施方式步骤1:对地址库中的地址进行预处理,去除地址字段中没有数字门牌号的地址,去除地址字段重复的地址。步骤2:如图1所示,将经过预处理的地址库中的地址进行切分,对切分结果进行初始聚类,根据初始聚类生成语义位置网初始层次结构,最后对初始层次结构中的问题进行修正,得到语义位置网。步骤3:如图2所示,给定待推测的地址位置,取地址的空间包围盒可以看作根据原始地址获取的语义位置网中和该地址具有语义形似关系的位置单元集合,由这些单元集合构成的空间范围代表了待推测地址的空间范围,这个范围被称为包围盒。步骤4:得到包围盒之后,需要得到这些地址在地址的语义编码和空间上表现出来的连续性特征,即包围盒的空间分布。包围盒中点集数量往往多本文档来自技高网...

【技术保护点】
1.一种基于语义位置网的地址位置推测方法,其特征在于:包括以下步骤:/n步骤1、对用来构建语义位置网的地址库中的地址进行预处理,具体是去除没有数字门牌号和字段重复的地址;处理后的地址库中地址的地址地段都唯一并且包含数字门牌号;/n步骤2、将步骤1中处理过的数据进行切分,构建语义位置网;/n步骤3、从语义位置网中获取待推测地址的空间包围盒;/n步骤4、从空间包围盒中获取最优分布;/n步骤5、从最优分布中提取方向、角度、距离这三种参数信息,结合最优分布中点集的空间坐标进行计算,得到待推测地址的空间坐标。/n

【技术特征摘要】
1.一种基于语义位置网的地址位置推测方法,其特征在于:包括以下步骤:
步骤1、对用来构建语义位置网的地址库中的地址进行预处理,具体是去除没有数字门牌号和字段重复的地址;处理后的地址库中地址的地址地段都唯一并且包含数字门牌号;
步骤2、将步骤1中处理过的数据进行切分,构建语义位置网;
步骤3、从语义位置网中获取待推测地址的空间包围盒;
步骤4、从空间包围盒中获取最优分布;
步骤5、从最优分布中提取方向、角度、距离这三种参数信息,结合最优分布中点集的空间坐标进行计算,得到待推测地址的空间坐标。


2.根据权利要求1所述的一种基于语义位置网的地址位置推测方法,其特征在于:在步骤2中,需要将经过预处理的地址库中的地址进行切分,然后对切分结果进行聚类,根据聚类结果生成语义位置网初始层次结构,最后对初始层次结构中的问题进行修正,得到最终语义位置网,具体包括:
步骤2.1:采用目前常用的基于规则与统计的方法对地址进行地址元素的解析和提取,完成对经过预处理的地址库中的地址的切分;
步骤2.2:将切分后的地址根据地址字符串中相同位置字符串拼音首字母的ASCII码大小按照升序进行排列,排列后将地址库中相邻的地址放在序列当中邻接位置,通过计算邻接地址之间的相似度,将地址结构近似的地址放到同一个类,完成地址库聚类;
步骤2.3:将每个类中的地址按照地址元素的等级构建语义位置网的初始层次结构,然后完成地址不完整修正和地址空间位置错误修正,形成最终的语义位置网结构。


3.根据权利要求1所述的一种基于语义位置网的地址位置推测方法,其特征在于:在步骤3中,从步骤2获取的语义位置网中获取和待推测地址具有语义形似关系的位置单元集合,这些单元集合构成的空间范围代表了待推测地址的空间范围,这个范围即为所求空间包围盒,具体包括:
步骤3.1:根据待预测地址的地址元素组成,从步骤2中获得的语义位置网中找到与待预测地址具有语义相近关系的位置单元;
步骤3.2:根据位置单元所构成的地址集合的空间位置,得...

【专利技术属性】
技术研发人员:李霖金榜朱海红沈航罗振威王维
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1