解析结果的确定方法和装置、存储介质及电子装置制造方法及图纸

技术编号:39182251 阅读:9 留言:0更新日期:2023-10-27 08:29
本发明专利技术提供了一种解析结果的确定方法和装置、存储介质及电子装置,其中,上述方法包括:通过字典匹配树对待解析地址进行匹配,以得到所述待解析地址对应的第一地域词组,其中,所述字典匹配树的子节点对应的字符用于指示以下之一:汉字、数字、英文、特殊字符;在地址字典库中确定包含任一所述第一地域词组的多个第一地址信息,其中,所述第一地址信息为标准结构的地址信息;确定所述多个第一地址信息分别对应的权重值;根据所述权重值和所述多个第一地址信息确定第二地址信息,并将所述第二地址信息作为所述待解析地址的解析结果。地址信息作为所述待解析地址的解析结果。地址信息作为所述待解析地址的解析结果。

【技术实现步骤摘要】
解析结果的确定方法和装置、存储介质及电子装置


[0001]本专利技术涉及通信领域,具体而言,涉及一种解析结果的确定方法和装置、存储介质及电子装置。

技术介绍

[0002]随着业务量的增长,企业积累了海量的第一地址信息。第一地址信息可应用在企业经营的各个方面,如金融企业将第一地址信息同地址黑名单库进行匹配,作为判定申请信息风险的辅助手段,以及分析银行客户社区覆盖度以开展针对性营销等。但是用户输入的第一地址信息带有极大的随机性,如层级不全、地址描述不规范、输入错误、重复输入和人为加“*”加密等情况,导致第一地址信息本身具有极大噪声,无法满足企业对结构化地址应用的需求。
[0003]以云缴费业务的地址解析为例,订单中的第一地址信息来源多、数据量大、略写随意多样、区划颗粒度不同且存在人为加“*”编码的情况,导致地址解析的难度极大。云缴费地址多来源、多噪声的特点,使得目前单一地址解析产品都无法满足地址匹配和解析的需求。同市面上成熟的地址解析产品对比发现,现有产品在解析银行多来源、多噪声的第一地址信息时其准确性较差。如“北京*阳区”为加密处理,正确地址应返回“北京朝阳区”,但地址解析产品返回的结果是“北京市

北京市

东城区”。
[0004]此外,对比类似如同百度地址解析的产品,会发现其无法同时判断多来源地址,也无法自定义各来源地址优先级,在面对多个省份具有同名区域街道和错误信息干扰的情况下无法破解。
[0005]针对相关技术中,对地址进行解析,得到的地址解析结果的准确性较差等问题,尚未提出有效的解决方案。

技术实现思路

[0006]本申请实施例提供了一种解析结果的确定方法和装置、存储介质及电子装置,以至少解决相关技术中,对地址进行解析,得到的地址解析结果的准确性较差等问题。
[0007]根据本申请实施例的一个实施例,提供了一种解析结果的确定方法,包括:通过字典匹配树对待解析地址进行匹配,以得到所述待解析地址对应的第一地域词组,其中,所述字典匹配树的子节点对应的字符用于指示以下之一:汉字、数字、英文、特殊字符;在地址字典库中确定包含任一所述第一地域词组的多个第一地址信息,其中,所述第一地址信息为标准结构的地址信息,所述第一地域词组为所述第一地址信息中的最后一级地域层级对应的地域信息;确定所述多个第一地址信息分别对应的权重值;根据所述权重值和所述多个第一地址信息确定第二地址信息,并将所述第二地址信息作为所述待解析地址的解析结果。
[0008]在一个示例性实施例中,通过字典匹配树对待解析地址进行匹配,以得到所述待解析地址对应的第一地域词组,至少包括以下之一:循环执行匹配步骤,直至在所述字典匹
配树上无法匹配;确定所述字典匹配树的根子节点至所述叶子节点的第一路径,并根据所述第一路径确定所述待解析地址对应的第二地域词组,其中,所述第一地域词组包括:所述第二地域词组;所述匹配步骤包括:将所述待解析地址的第一字符与所述字典匹配树的第一子节点的字符进行匹配;在所述第一字符与所述第一子节点的字符匹配的情况下,将所述待解析地址的第二字符与所述字典匹配树的第二子节点的字符进行匹配,其中,所述第二字符为所述待解析地址中所述第一字符之后的第一个字符,所述第二子节点为所述第一子节点的子节点。
[0009]在一个示例性实施例中,将所述待解析地址的第二字符与所述字典匹配树的第二子节点的字符进行匹配,包括:在所述第二字符与所述第二子节点的字符不匹配的情况下,确定所述第二子节点的父节点,其中,所述第二子节点的父节点为所述第一子节点;确定所述父节点对应的回退节点,以及确定第三子节点的字符是否与所述第二字符匹配,其中,所述第三子节点为所述回退节点的子节点;在所述第三子节点的字符与所述第二字符不匹配的情况下,确定所述字典匹配树的根子节点至所述第二子节点的第二路径,并根据所述第二路径确定所述待解析地址对应的第二地域词组。
[0010]在一个示例性实施例中,确定所述多个第一地址信息分别对应的权重值,包括:确定所述多个第一地址信息中的每一第三地域词组对应的第一地域词组;根据所述每一第三地域词组对应的第一地域词组的个数确定每一第三地域词组的权重值;根据所述每一第三地域词组的权重值确定所述多个第一地址信息分别对应的权重值。
[0011]在一个示例性实施例中,根据所述权重值和所述第一地址信息确定第二地址信息,包括:在多个权重值中确定最高权重值,以及确定所述最高权重值对应的第三地址信息;在所述最高权重值的数量为多个的情况下,确定多个所述第三地址信息对应的差异地域信息;确定所述差异地域信息的前一个或多个地域层次的地域信息为所述第二地址信息。
[0012]在一个示例性实施例中,在所述待解析地址为目标对象的多个地址的情况下,将所述第二地址信息作为所述待解析地址的解析结果之后,所述方法还包括:根据多个待解析地址的多个解析结果建立投票树,其中,所述投票树的任一分支用于指示任一解析结果;确定所述投票树的第二层的第四子节点对应的来源数量N和来源信息,其中,所述来源数量N用于指示所述第四子节点根据N个解析结果建立的;根据所述来源数量N和所述来源信息确定所述目标对象的目标地址信息。
[0013]在一个示例性实施例中,根据所述来源数量N和所述来源信息确定所述目标对象的目标地址信息,包括:确定最大来源数量,以及所述最大来源数量对应的第五子节点;确定所述第五子节点的来源信息,以及根据所述第五子节点的来源信息确定优先级最高的来源;在所述投票树中确定所述优先级最高的来源对应的分支,将所述分支对应的地址信息作为所述目标对象的目标地址信息。
[0014]在一个示例性实施例中,在所述第一地域词组包括:所述特殊字符的情况下,在地址字典库中确定包含任一所述第一地域词组的多个第一地址信息,包括:在地址字典库中确定与所述第一地域词组结构相同的第四地域词组;在地址字典库中确定包含任一所述第四地域词组的多个第一地址信息。
[0015]在一个示例性实施例中,通过字典匹配树对待解析地址进行匹配之前,所述方法
还包括:确定所述字典匹配树的节点,其中,所述节点的节点信息包括:字符,fail指针、tail尾部标志、子节点以及字符在字典中的索引号;根据所述字典匹配树的节点构建所述字典匹配树,其中,所述字典匹配树中的每一分支用于指示一个地域词组。
[0016]根据本申请实施例的另一个实施例,还提供了一种地址的确定装置,包括:匹配模块,用于通过字典匹配树对待解析地址进行匹配,以得到所述待解析地址对应的第一地域词组,其中,所述字典匹配树的子节点对应的字符用于指示以下之一:汉字、数字、英文、特殊字符;第一确定模块,用于在地址字典库中确定包含任一所述第一地域词组的多个第一地址信息,其中,所述第一地址信息为标准结构的地址信息,所述第一地域词组为所述第一地址信息中的最后一级地域层级对应的地域信息;第二确定模块,用于确定所述多个第一地址信息分别对应的权重值;第三确定模块,用于根据所述权重值和所述多个第一地址信息确定第二本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种解析结果的确定方法,其特征在于,包括:通过字典匹配树对待解析地址进行匹配,以得到所述待解析地址对应的第一地域词组,其中,所述字典匹配树的子节点对应的字符用于指示以下之一:汉字、数字、英文、特殊字符;在地址字典库中确定包含任一所述第一地域词组的多个第一地址信息,其中,所述第一地址信息为标准结构的地址信息,所述第一地域词组为所述第一地址信息中的最后一级地域层级对应的地域信息;确定所述多个第一地址信息分别对应的权重值;根据所述权重值和所述多个第一地址信息确定第二地址信息,并将所述第二地址信息作为所述待解析地址的解析结果。2.根据权利要求1所述的方法,其特征在于,通过字典匹配树对待解析地址进行匹配,以得到所述待解析地址对应的第一地域词组,至少包括以下之一:循环执行匹配步骤,直至在所述字典匹配树上无法匹配;确定所述字典匹配树的根子节点至叶子节点的第一路径,并根据所述第一路径确定所述待解析地址对应的第二地域词组,其中,所述第一地域词组包括:所述第二地域词组;所述匹配步骤包括:将所述待解析地址的第一字符与所述字典匹配树的第一子节点的字符进行匹配;在所述第一字符与所述第一子节点的字符匹配的情况下,将所述待解析地址的第二字符与所述字典匹配树的第二子节点的字符进行匹配,其中,所述第二字符为所述待解析地址中所述第一字符之后的第一个字符,所述第二子节点为所述第一子节点的子节点。3.根据权利要求2所述的方法,其特征在于,将所述待解析地址的第二字符与所述字典匹配树的第二子节点的字符进行匹配,包括:在所述第二字符与所述第二子节点的字符不匹配的情况下,确定所述第二子节点的父节点,其中,所述第二子节点的父节点为所述第一子节点;确定所述父节点对应的回退节点,以及确定第三子节点的字符是否与所述第二字符匹配,其中,所述第三子节点为所述回退节点的子节点;在所述第三子节点的字符与所述第二字符不匹配的情况下,确定所述字典匹配树的根子节点至所述第二子节点的第二路径,并根据所述第二路径确定所述待解析地址对应的第二地域词组。4.根据权利要求1所述的方法,其特征在于,确定所述多个第一地址信息分别对应的权重值,包括:确定所述多个第一地址信息中的每一第三地域词组对应的第一地域词组;根据所述每一第三地域词组对应的第一地域词组的个数确定每一第三地域词组的权重值;根据所述每一第三地域词组的权重值确定所述多个第一地址信息分别对应的权重值。5.根据权利要求1所述的方法,其特征在于,根据所述权重值和所述第一地址信息确定第二地址信息,包括:在多个权重值中确定最高权重值,以及确定所述最高权重值对应的第三地址信息;在所述最高权重值的数量为多个的情况下,确定多个所述第三地址信息对应的差异地
域信息;确定所述差异地域信息的前一个或多个地域层次的地域信息为所述第二地址信息。6.根据权利要求1所述的方法,其特征在于,在所述待解析地址...

【专利技术属性】
技术研发人员:周成龙王宏丽胡振禹杨欣竹房云鹏郭皓李德杰马仕柏刘方昊
申请(专利权)人:中国光大银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1