【技术实现步骤摘要】
一种客户标准地址数据库的更新方法及系统
[0001]本专利技术涉及数据处理
,具体涉及一种客户标准地址数据库的更新方法及系统。
技术介绍
[0002]在物流配送及汽车导航等各种涉及地址使用的服务行业中,标准地址数据库内的数据充盈度及各地址的标准度与服务效率及服务质量息息相关。因此,需要不断将新地址存入所述标准地址数据库内,并在将新地址存入所述标准地址数据库前对相应的新地址进行标准化处理。
[0003]现有技术中,对于新地址的标准化处理,多通过如下步骤进行:首先,基于用户的当前定位请求获取相应的地址参数;然后,基于第三方地址编码API在本地ES库内筛选与所述地址参数相似的若干个地址节点;最终,将所述地址参数与各地址节点分别对比并选取偏移量最小的作为与用户的当前定位请求相应的标准地址,并将其存入标准地址数据库内。
[0004]但该方法仅适用于新地址来源于用户定位请求的地址标准化情况。而在实际使用时,新地址多表现为用户输入的多种多样的文本信息形式,同时受用户输入过程影响,这些文本信息与基于定位请求获取的地址参 ...
【技术保护点】
【技术特征摘要】
1.一种客户标准地址数据库的更新方法,其特征在于,包括:获取与原始地址对应的文本信息,并基于配置表对所述文本信息进行拆分以得到相应的区域地址数组及详情地址数组;其中,所述区域地址数组由高至低依次包括:省级地址、市级地址、县级地址、镇级地址及社区级地址;所述详情地址数组由高至低依次包括:楼栋地址及门牌地址;拼接所述区域地址数组中的所有地址层级及所述详情地址数组中的最高地址层级以获得第一拼接地址,并基于第三方地址标准化API对所述第一拼接地址进行补充以得到第一补全地址,及与所述第一补全地址相应的经纬度数据;基于Trie树结构将所述区域地址数组匹配至分词匹配表内,并取相应子节点中的关联地址对所述区域地址数组进行补充以得到补充区域地址数组;拼接所述补充区域地址数组中的所有地址层级及所述详情地址数组中的最高地址层级以获得第二拼接地址,并基于第三方地址标准化API对所述第二拼接地址进行补充以得到第二补全地址,及与所述第二补全地址相应的经纬度数据;通过分别计算所述第一补全地址、所述第二补全地址中各地址层级的权重和,并取与较大权重和对应的第一补全地址或第二补全地址作为预标准地址;其中,k为地址层级的总数,y
i
表示第i个地址层级是否为空值,y
i
=0表示为空值,y
i
=1表示有填充值,x
i
表示所述第一补全地址或所述第二补全地址中第i个地址层级与所述原始地址中第i个地址层级进行模糊匹配后的命中率,x
j
表示所述第一补全地址或所述第二补全地址中第j个地址层级与所述原始地址中第j个地址层级进行模糊匹配后的命中率,f
ij
表示所述第一补全地址或所述第二补全地址中第j个地址层级命中后对第i个地址层级的影响系数;基于所述详情地址数组对所述预标准地址进行补充以作为标准地址,并将所述标准地址及与之对应的经纬度数据存入标准地址数据库内以对其进行更新。2.根据权利要求1所述的客户标准地址数据库的更新方法,其特征在于,所述基于配置表对所述文本信息进行拆分以得到相应的区域地址数组及详情地址数组之前,包括:基于模糊语义算法对所述文本信息进行处理以修正其内的错误表述信息或缺陷表述信息。3.根据权利要求1所述的客户标准地址数据库的更新方法,其特征在于,所述将所述标准地址及与之对应的经纬度数据存入标准地址数据库内之后,包括:基于Trie树结构及多模式匹配算法对所述标准地址及所述分词匹配表间进行字符串匹配;若匹配失败则基于所述标准地址在所述分词匹配表中构建新增地址节点。4.根据权利要求1所述的客户标准地址数据库的更新方法,其特征在于,所述将所述标准地址及与之对应的经纬度数据存入标准地址数据库内之后,包括:对比所述标准地址与所述标准数据库中的原有地址以补充所述原有地址中缺少的地址层级,或修改所述原有地址中有误的地...
【专利技术属性】
技术研发人员:邰伟鹏,卞义,李伟,陈业斌,
申请(专利权)人:安徽工业大学科技园有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。