一种地点名称识别方法、系统、装置及存储介质制造方法及图纸

技术编号:35345420 阅读:17 留言:0更新日期:2022-10-26 12:10
本发明专利技术实施例提供了一种地点名称识别方法、系统、装置及存储介质,其中,方法包括:从预设地名查找树中查询与第一地点组中的各第一地点名称匹配的节点,提取查询到的各节点的节点信息,获得节点信息组,其中,预设地名查找树中包括有多个节点,相连接的两个节点对应的地点名称具有从属关系,第一地点组中的各第一地点名称是从语句中提取的,基于各第一地点名称在语句中的起止位置数据,更新节点信息组中各第一地点名称匹配的各节点信息中的初始起止位置,获得初始信息组,基于初始信息组,对各第一地点名称进行第一操作和第二操作,获得包括多个第二地点名称的第二地点组。本发明专利技术提高了对地点名称识别的准确度。对地点名称识别的准确度。对地点名称识别的准确度。

【技术实现步骤摘要】
一种地点名称识别方法、系统、装置及存储介质


[0001]本专利技术涉及实体识别
,特别是涉及一种地点名称识别方法、系统、装置及存储介质。

技术介绍

[0002]地名识别是命名实体识别(Named Entity Recognition,NER)的一个重要应用领域。现有的地名识别技术是通过深度学习模型,对输入的语料进行地名识别。
[0003]由于深度学习模型的泛化性较强,导致识别出的地名由于不符合自然语言规则,无法实现对语句中地名的准确识别和解析。且现有深度学习模型是基于人工标注后的数据进行地名识别的。在人工标注数据的质量不高时,易使训练后的深度学习模型识别出不存在地名,降低了对地名识别的准确度。因此如何提高对地名识别的准确度,已成为亟待解决的问题。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种地点名称识别方法、系统、装置及存储介质,以提高对地点名称识别的准确度。具体技术方案如下:
[0005]一种地点名称识别方法,所述方法包括:
[0006]从预设地名查找树中查询与第一地点组中的各第一地点名称匹配的节点,提取查询到的各节点的节点信息,获得节点信息组,其中,所述预设地名查找树中包括有多个节点,相连接的两个节点对应的地点名称具有从属关系,所述第一地点组中的各第一地点名称是从语句中提取的。
[0007]基于各第一地点名称在所述语句中的起止位置数据,更新所述节点信息组中各第一地点名称匹配的各节点信息中的初始起止位置,获得初始信息组。
[0008]基于所述初始信息组,对各第一地点名称进行第一操作和第二操作,获得包括多个第二地点名称的第二地点组。
[0009]可选的,所述基于各第一地点名称在所述语句中的起止位置数据,更新所述节点信息组中各第一地点名称匹配的各节点信息中的初始起止位置,获得初始信息组,包括:
[0010]对各第一地点名称,获取该第一地点名称的首字符和末字符的位置数据。将所述首字符的所述位置数据,确定为该第一地点名称的起始位置数据。将所述末字符的所述位置数据,确定为该第一地点名称的终止位置数据。利用所述起始位置数据和所述终止位置数据,更新与该第一地点名称匹配的所述节点信息中的初始起止位置。将该第一地点名称更新后的节点信息,确定为该第一地点名称的初始地名信息。
[0011]获得包括多个所述初始地名信息的所述初始信息组,其中,所述第一地点名称与所述初始地名信息存在对应关系。
[0012]可选的,所述基于所述初始信息组,对各第一地点名称进行第一操作和第二操作,获得包括多个第二地点名称的第二地点组,包括:
[0013]对各第一地点名称,根据该第一地点名称对应地初始地名信息中的从属关系标识符,判断所述初始信息组中,是否存在该第一地点名称的上级地点名称。若是,则将该第一地点名称确定为待合并地点名称。在所述初始信息组中,不存在该第一地点名称的所述上级地点名称时,则将该第一地点名称确定为初始独立地点名称。
[0014]对具有所述从属关系的各待合并地点名称的初始地名信息进行所述第一操作,获得合并地名组,其中,所述合并地名组中包括至少一个合并地点名称及其对应的合并地名信息,所述合并地点名称中包括不少于两个的第一地点名称。
[0015]根据所述合并地名组和各初始独立地点名称的初始地名信息,执行所述第二操作,获得所述第二地点组。
[0016]可选的,所述根据所述合并地名组和各初始独立地点名称的初始地名信息,执行所述第二操作,获得所述第二地点组,包括:
[0017]对各初始独立地点名称执行所述第二操作:判断该初始独立地点名称的初始起止位置的区间,是否位于所述合并地名组中,至少一个合并地名信息的初始起止位置的区间内,若是,则将该初始独立地点名称及其对应地初始地名信息进行删除。若否,则将该初始独立地点名称确定为独立地点名称。
[0018]将各合并地点名称和各独立地点名称均确定为第二地点名称,获得所述第二地点组。
[0019]可选的,还包括:
[0020]对各初始独立地点名称执行所述第二操作:判断该初始独立地点名称的地名字符,与用户终端数据中的输入地名字符的匹配度是否大于预设阈值,若否,则将该初始独立地点名称及其初始地名信息进行删除。若是,则将该初始独立地点名称确定为独立地点名称。
[0021]将各合并地点名称和各独立地点名称均确定为第二地点名称,获得所述第二地点组。
[0022]可选的,在获得所述第一地点组的情况下,所述方法还包括:
[0023]利用预设地名补全字典,根据各第二地点名称的从属关系标识符,对各第二地点名称进行隶属关系补全,获得最终地点组。
[0024]一种地点名称识别系统,所述系统包括:
[0025]第一信息获取单元,用于从预设地名查找树中查询与第一地点组中的各第一地点名称匹配的节点,提取查询到的各节点的节点信息,获得节点信息组,其中,所述预设地名查找树中包括有多个节点,相连接的两个节点对应的地点名称具有从属关系,所述第一地点组中的各第一地点名称是从语句中提取的。
[0026]第二信息获取单元,基于各第一地点名称在所述语句中的起止位置数据,更新所述节点信息组中各第一地点名称匹配的各节点信息中的初始起止位置,获得初始信息组。
[0027]地名获取单元,基于所述初始信息组,对各第一地点名称进行第一操作和第二操作,获得包括多个第二地点名称的第二地点组。
[0028]可选的,所述第二信息获取单元被设置为:
[0029]对各第一地点名称,获取该第一地点名称的首字符和末字符的位置数据。将所述首字符的所述位置数据,确定为该第一地点名称的起始位置数据。将所述末字符的所述位
置数据,确定为该第一地点名称的终止位置数据。利用所述起始位置数据和所述终止位置数据,更新与该第一地点名称匹配的所述节点信息中的初始起止位置。将该第一地点名称更新后的节点信息,确定为该第一地点名称的初始地名信息。
[0030]获得包括多个所述初始地名信息的所述初始信息组,其中,所述第一地点名称与所述初始地名信息存在对应关系。
[0031]可选的,所述地名获取单元被设置为:
[0032]对各第一地点名称,根据该第一地点名称对应地初始地名信息中的从属关系标识符,判断所述初始信息组中,是否存在该第一地点名称的上级地点名称。若是,则将该第一地点名称确定为待合并地点名称。在所述初始信息组中,不存在该第一地点名称的所述上级地点名称时,则将该第一地点名称确定为初始独立地点名称。
[0033]对具有所述从属关系的各待合并地点名称的初始地名信息进行所述第一操作,获得合并地名组,其中,所述合并地名组中包括至少一个合并地点名称及其对应的合并地名信息,所述合并地点名称中包括不少于两个的第一地点名称。
[0034]根据所述合并地名组和各初始独立地点名称的初始地名信息,执行所述第二操作,获得所述第二地点组。
[0035]可选的,所述地名获取单元在根据所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地点名称识别方法,其特征在于,所述方法包括:从预设地名查找树中查询与第一地点组中的各第一地点名称匹配的节点,提取查询到的各节点的节点信息,获得节点信息组,其中,所述预设地名查找树中包括有多个节点,相连接的两个节点对应的地点名称具有从属关系,所述第一地点组中的各第一地点名称是从语句中提取的;基于各第一地点名称在所述语句中的起止位置数据,更新所述节点信息组中各第一地点名称匹配的各节点信息中的初始起止位置,获得初始信息组;基于所述初始信息组,对各第一地点名称进行第一操作和第二操作,获得包括多个第二地点名称的第二地点组。2.根据权利要求1所述的方法,其特征在于,所述基于各第一地点名称在所述语句中的起止位置数据,更新所述节点信息组中各第一地点名称匹配的各节点信息中的初始起止位置,获得初始信息组,包括:对各第一地点名称,获取该第一地点名称的首字符和末字符的位置数据;将所述首字符的所述位置数据,确定为该第一地点名称的起始位置数据;将所述末字符的所述位置数据,确定为该第一地点名称的终止位置数据;利用所述起始位置数据和所述终止位置数据,更新与该第一地点名称匹配的所述节点信息中的初始起止位置;将该第一地点名称更新后的节点信息,确定为该第一地点名称的初始地名信息;获得包括多个所述初始地名信息的所述初始信息组,其中,所述第一地点名称与所述初始地名信息存在对应关系。3.根据权利要求2所述的方法,其特征在于,所述基于所述初始信息组,对各第一地点名称进行第一操作和第二操作,获得包括多个第二地点名称的第二地点组,包括:对各第一地点名称,根据该第一地点名称对应地初始地名信息中的从属关系标识符,判断所述初始信息组中,是否存在该第一地点名称的上级地点名称;若是,则将该第一地点名称确定为待合并地点名称;在所述初始信息组中,不存在该第一地点名称的所述上级地点名称时,则将该第一地点名称确定为初始独立地点名称;对具有所述从属关系的各待合并地点名称的初始地名信息进行所述第一操作,获得合并地名组,其中,所述合并地名组中包括至少一个合并地点名称及其对应的合并地名信息,所述合并地点名称中包括不少于两个的第一地点名称;根据所述合并地名组和各初始独立地点名称的初始地名信息,执行所述第二操作,获得所述第二地点组。4.根据权利要求3所述的方法,其特征在于,所述根据所述合并地名组和各初始独立地点名称的初始地名信息,执行所述第二操作,获得所述第二地点组,包括:对各初始独立地点名称执行所述第二操作:判断该初始独立地点名称的初始起止位置的区间,是否位于所述合并地名组中,至少一个合并地名信息的初始起止位置的区间内,若是,则将该初始独立地点名称...

【专利技术属性】
技术研发人员:温兴超
申请(专利权)人:海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1