地址拆分和补全方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:31928435 阅读:16 留言:0更新日期:2022-01-15 13:16
本发明专利技术涉及文本处理技术领域,提供了一种地址拆分和补全方法、装置、计算机设备和存储介质,所述方法包括:依次以文本中各字符为节点进行拆分和匹配,得到所述文本中存在的地点以及所述地点对应的地点类型;遍历各所述地点,根据所述地点类型从当前遍历地点的前置相邻地点中确定当前遍历地点的最佳前置相邻地点;根据各所述地点的最佳前置相邻地点,组合得到所述文本中的地址信息;当所述地址信息中存在行政区划级别缺失且属于同名地点的地点数据时,根据相邻地点的地点类型补全所述地点数据的行政区划级别。采用本方法能够提高地址补全的准确性。补全的准确性。补全的准确性。

【技术实现步骤摘要】
地址拆分和补全方法、装置、计算机设备和存储介质


[0001]本专利技术属于文本处理
,尤其涉及一种地址拆分和补全方法、装置、计算机设备和存储介质。

技术介绍

[0002]地址补全是指对缺失的地址信息进行补全的处理,传统的地址补全通常是将所有的地址信息存储在数据库中,然后根据输入的地址关键词进行匹配。然而,由于地址信息太多且同名的地址信息也很多,导致现有补全方式准确率有所下降。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够提高地址补全的准确性的地址拆分和补全方法、装置、计算机设备和存储介质。
[0004]本专利技术提供一种地址拆分和补全方法,包括:依次以文本中各字符为节点进行拆分和匹配,得到所述文本中存在的地点以及所述地点对应的地点类型;遍历各所述地点,根据所述地点类型从当前遍历地点的前置相邻地点中确定当前遍历地点的最佳前置相邻地点;根据各所述地点的最佳前置相邻地点,组合得到所述文本中的地址信息;当所述地址信息中存在行政区划级别缺失且属于同名地点的地点数据时,根据相邻地点的地点类型补全所述地点数据的行政区划级别。
[0005]在其中一个实施例中,所述依次以文本中各字符为节点进行拆分和匹配,得到所述文本中存在的地点以及所述地点对应的地点类型,包括:从所述文本中的第一个字符开始遍历;每访问到一个字符,则以当前访问的字符为节点进行拆分,得到拆分字符;所述拆分字符包括当前访问的字符以及当前访问的字符的前置字符;将所述拆分字符与预设的地点字典进行匹配,确定所述拆分字符中存在的地点以及所述地点的地点类型,直至字符遍历结束,得到所述文本中存在的地点以及所述地点的地点类型。
[0006]在其中一个实施例中,所述遍历各所述地点,根据所述地点类型从当前遍历地点的前置相邻地点中确定当前遍历地点的最佳前置相邻地点,包括:根据所述当前遍历地点的首个字符在所述文本中的位置,确定所述当前遍历地点对应的前置相邻地点;根据所述当前遍历地点以及所述前置相邻地点的地点类型,从预设的位置关系估值权重字典中确定对应的位置关系估值权重;根据所述位置关系估值权重确定所述当前遍历地点的最佳前置相邻地点。
[0007]在其中一个实施例中,所述根据各所述地点的最佳前置相邻地点,组合得到所述
文本中的地址信息,包括:从最后一个地点为起始节点,往前查找各所述地点的最佳前置相邻地点,并以当前查找到的最佳前置相邻地点为新的起始节点继续往前查找各所述地点的最佳前置相邻地点,直至查找到非地点数据;组合所查找到的最佳前置相邻地点,得到所述文本中的地址信息。
[0008]在其中一个实施例中,所述当所述地址信息中存在行政区划级别缺失的地点数据且属于同名地点的地点数据时,根据相邻地点的所述地点类型补全所述地点的行政区划级别,包括:当所述地址信息中存在行政区划级别缺失且属于同名地点的地点数据时,根据所述相邻地点的地点类型与所述地点数据的地点类型的位置关系,从预设的位置关系估值权重字典中确定对应的位置关系估值权重;根据所述位置关系估值权重确定所述地点数据的行政区划级别。
[0009]在其中一个实施例中,所述根据相邻地点的地点类型补全所述地点数据的行政区划级别之后,还包括:确定行政区划级别补全后的地址信息的行政区划代码;根据所述行政区划代码对所述地址信息进行二次补全。
[0010]一种地址拆分和补全装置,包括:拆分匹配模块,用于依次以文本中各字符为节点进行拆分和匹配,得到所述文本中存在的地点以及所述地点对应的地点类型;遍历确定模块,用于遍历各所述地点,根据所述地点类型从当前遍历地点的前置相邻地点中确定当前遍历地点的最佳前置相邻地点;组合模块,用于根据各所述地点的最佳前置相邻地点,组合得到所述文本中的地址信息;补全模块,用于当所述地址信息中存在行政区划级别缺失且属于同名地点的地点数据时,根据相邻地点的地点类型补全所述地点数据的行政区划级别。
[0011]本专利技术还提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储由计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的地址拆分和补全方法的步骤。
[0012]本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的地址拆分和补全方法的步骤。
[0013]上述地址拆分和补全方法、装置、计算机设备和存储介质,通过依次以文本中各字符为节点进行拆分和匹配,得到文本中存在的地点以及地点对应的地点类型;遍历各地点,根据地点类型从当前遍历地点的前置相邻地点中确定当前遍历地点的最佳前置相邻地点;根据各地点的最佳前置相邻地点,组合得到文本中的地址信息;当地址信息中存在行政区划级别缺失且属于同名地点的地点数据时,根据相邻地点的地点类型补全地点数据的行政区划级别。该方法通过逐字拆分进行精细地点匹配且同时结合前后相邻地点的地点类型进行地点的补全,提高文本地点匹配准确率的同时,即使存在同名地点也能依靠前后相邻地点准确地补全地址。
附图说明
[0014]图1为一个实施例中地址拆分和补全方法的应用环境图。
[0015]图2为一个实施例中地址拆分和补全方法的流程示意图。
[0016]图3为一个实施例中地址拆分和补全装置的结构框图。
具体实施方式
[0017]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0018]本申请提供的地址拆分和补全方法,可以应用于如图1所示的应用环境中,该应用环境涉及终端102和服务器104。其中,终端102通过网络与服务器104进行通信。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和携带式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0019]当终端102接收到地址补全指令时,可以由终端102单独实现上述地址拆分补全方法。也可以由终端102将地址补全指令发送给通信的服务器104,由服务器104实现上述地址拆分补全方法。以服务器104为例,具体的,服务器104依次以文本中各字符为节点进行拆分和匹配,得到文本中存在的地点以及地点对应的地点类型;服务器104遍历各地点,根据地点类型从当前遍历地点的前置相邻地点中确定当前遍历地点的最佳前置相邻地点;服务器104根据各地点的最佳前置相邻地点,组合得到文本中的地址信息;服务器104当地址信息中存在行政区划级别缺失且属于同名地点的地点数据时,根据相邻地点的地点类型补全地点数据的行政区划级别。
[0020]在一个实施例中,如图2所示,提供一种地址拆分和补全方法,以该方法应用于服务器为例进行说明,包括以下步骤:步骤S201,依次以文本中各字符为节点进行拆分和匹配,得到文本中存在的地点以及地点对应的地点类型。
[0021]具体的,当接收到地址补全指令时,服务器获取该地址补全指令所对应的文本。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地址拆分和补全方法,其特征在于,包括:依次以文本中各字符为节点进行拆分和匹配,得到所述文本中存在的地点以及所述地点对应的地点类型;遍历各所述地点,根据所述地点类型从当前遍历地点的前置相邻地点中确定当前遍历地点的最佳前置相邻地点;根据各所述地点的最佳前置相邻地点,组合得到所述文本中的地址信息;当所述地址信息中存在行政区划级别缺失且属于同名地点的地点数据时,根据相邻地点的地点类型补全所述地点数据的行政区划级别。2.根据权利要求1所述的方法,其特征在于,所述依次以文本中各字符为节点进行拆分和匹配,得到所述文本中存在的地点以及所述地点对应的地点类型,包括:从所述文本中的第一个字符开始遍历;每访问到一个字符,则以当前访问的字符为节点进行拆分,得到拆分字符;所述拆分字符包括当前访问的字符以及当前访问的字符的前置字符;将所述拆分字符与预设的地点字典进行匹配,确定所述拆分字符中存在的地点以及所述地点的地点类型,直至字符遍历结束,得到所述文本中存在的地点以及所述地点的地点类型。3.根据权利要求1所述的方法,其特征在于,所述遍历各所述地点,根据所述地点类型从当前遍历地点的前置相邻地点中确定当前遍历地点的最佳前置相邻地点,包括:根据所述当前遍历地点的首个字符在所述文本中的位置,确定所述当前遍历地点对应的前置相邻地点;根据所述当前遍历地点以及所述前置相邻地点的地点类型,从预设的位置关系估值权重字典中确定对应的位置关系估值权重;根据所述位置关系估值权重确定所述当前遍历地点的最佳前置相邻地点。4.根据权利要求1所述的方法,其特征在于,所述根据各所述地点的最佳前置相邻地点,组合得到所述文本中的地址信息,包括:从最后一个地点为起始节点,往前查找各所述地点的最佳前置相邻地点,并以当前查找到的最佳前置相邻地点为新的起始节点继续往前查找各所述地点的最佳前置相邻地点,直至查找到非...

【专利技术属性】
技术研发人员:王志超李敬赫中翮阳建仁周忠诚段炼左凌峰刘勋鹏王路胡月刘杰付晋宇
申请(专利权)人:湖南四方天箭信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1