地址信息管理的方法和装置制造方法及图纸

技术编号:28941987 阅读:21 留言:0更新日期:2021-06-18 21:48
本发明专利技术公开了地址信息管理的方法和装置,涉及计算机技术领域。该方法的具体实施方式包括:将初始的地址信息集对应的目标地理区域划分成多个区域分块;分别以每个区域分块作为待融合区域,将待融合区域内相似的地址信息合并,得到更新后的地址信息集;分别以多个区域分块作为新的待融合区域,根据更新后的地址信息集,将待融合区域内相似的地址信息合并,得到再次更新后的地址信息集;逐渐扩大待融合区域的地理范围以进一步更新地址信息集,直至待融合区域的地理范围满足预设条件。该实施方式能够解决因数据量过大导致的空间复杂度和时间复杂度较高的问题,同时可很大程度地降低因相似地理信息融合不完全导致的数据误差。

【技术实现步骤摘要】
地址信息管理的方法和装置
本专利技术涉及计算机
,尤其涉及一种地址信息管理的方法和装置。
技术介绍
由于地址信息书写不规范,同一个地理位置可能对应多个地址信息,同一个地址信息也有可能对应多个地理位置。因此有必要对地址信息进行融合处理,以使每个地址位置唯一对应一个地址信息。图1是现有技术中地址融合的示意图。如图1所示,现有技术中在对地址信息进行比对融合的过程中,通常直接在地址之间两两计算。这种地址融合方法的计算量太过庞大。
技术实现思路
有鉴于此,本专利技术实施例提供一种地址信息管理的方法和装置,通过采用地理空间的逐级分块策略,能够解决因数据量过大导致的空间复杂度和时间复杂度较高的问题,同时可很大程度地降低因相似地理信息融合不完全导致的数据误差。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种地址信息管理的方法,包括:将初始的地址信息集对应的目标地理区域划分成多个区域分块;分别以每个所述区域分块作为待融合区域,将所述待融合区域内相似的地址信息合并,得到更新后的地址信息集;本文档来自技高网...

【技术保护点】
1.一种地址信息管理的方法,其特征在于,包括:/n将初始的地址信息集对应的目标地理区域划分成多个区域分块;/n分别以每个所述区域分块作为待融合区域,将所述待融合区域内相似的地址信息合并,得到更新后的地址信息集;/n分别以多个所述区域分块作为新的待融合区域,根据更新后的地址信息集,将所述待融合区域内相似的地址信息合并,得到再次更新后的地址信息集;/n逐渐扩大所述待融合区域的地理范围以进一步更新所述地址信息集,直至所述待融合区域的地理范围满足预设条件。/n

【技术特征摘要】
1.一种地址信息管理的方法,其特征在于,包括:
将初始的地址信息集对应的目标地理区域划分成多个区域分块;
分别以每个所述区域分块作为待融合区域,将所述待融合区域内相似的地址信息合并,得到更新后的地址信息集;
分别以多个所述区域分块作为新的待融合区域,根据更新后的地址信息集,将所述待融合区域内相似的地址信息合并,得到再次更新后的地址信息集;
逐渐扩大所述待融合区域的地理范围以进一步更新所述地址信息集,直至所述待融合区域的地理范围满足预设条件。


2.如权利要求1所述的方法,其特征在于,将所述待融合区域内相似的地址信息合并,包括:
将所述待融合区域内所有的地址信息排序,得到地址列表清单;
判断所述地址列表清单中任意一个地址信息与与其相邻的地址信息之间是否相似;
若是,则将所述任意一个地址信息与与其相邻的地址信息合并为一个地址信息;否则遍历所述地址列表清单中的下一个地址信息。


3.如权利要求1所述的方法,其特征在于,所述方法还包括:
在判断所述地址列表清单中任意一个地址信息与与其相邻的地址信息之间是否相似之前,确认所述任意一个地址信息的精度级别小于等于精度级别阈值;
若所述任意一个地址信息的精度级别大于所述精度级别阈值,则将所述任意一个地址信息的精度级别调整至小于等于所述精度级别阈值。


4.如权利要求1所述的方法,其特征在于,所述还包括:根据文本相似度以及空间距离判断两个地址信息之间是否相似。


5.如权利要求4所述的方法,其特征在于,根据文本相似度判断两个地址信息之间是否相似,包括:
确定所述两个地址信息的地址文本之间的匹配片段长度,以及所述两个地址信息中每个地址信息的地址文本长度;
根据所述匹配片段长度、以及所述两个地址信息中每个地址信息的地址文本长度,确定所述两个地址信息之间的文本相似度;
判断所述文本相似度是否大于文本相似度阈值;若是,则判定所述两个地址信息之间相似;否则,判定所述两个地址信息之间不相似。


6.如权利要求4所述的方法,其特征...

【专利技术属性】
技术研发人员:冯军芳黄泽宇王洪良
申请(专利权)人:北京汇钧科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1