命名实体识别方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:29286069 阅读:18 留言:0更新日期:2021-07-16 23:56
本申请实施例提供了一种命名实体识别方法、装置、用于电商平台的命名实体识别方法、装置、案件线索的识别方法、装置、内容识别方法、装置、电子设备及计算机存储介质。命名实体识别方法包括:生成待识别文本对应的基础图,基础图包括多个字符节点;获取与待识别文本匹配的词语搭配规则,词语搭配规则包括若干个词语以及若干个词语之间的语序关系;从基础图的多个字符节点中确定出与词语搭配规则中的词语所对应的若干个第一字符节点;根据词语搭配规则中的词语之间的语序关系,在基础图中至少加入用于表征词语搭配规则的连接边,生成目标图以识别待识别文本中的命名实体,用于表征词语搭配规则的连接边与部分或全部若干个第一字符节点连接。符节点连接。符节点连接。

Named entity recognition method, device, electronic equipment and computer storage medium

【技术实现步骤摘要】
命名实体识别方法、装置、电子设备及计算机存储介质


[0001]本申请实施例数据处理
,尤其涉及一种命名实体识别方法、装置、用于电商平台的命名实体识别方法、装置、案件线索的识别方法、装置、内容识别方法、装置、电子设备及计算机存储介质。

技术介绍

[0002]命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指通过自动化的方法,自动识别文本中具有特定意义的实体,主要包括人名、地名、机构名、商品名、专有名词等。命名实体识别在文本处理领域,例如问答系统、翻译等具有重要作用。
[0003]但是,有些词语在不同的情况下可以理解为不同的意思,即需要识别为不同的实体,例如“卡片手机”中的“卡片”应该识别为一个电子产品的类型,而“DIY卡片”中的“卡片”应该识别为一种物品的名称。由于词语可以理解为不同的意思,使得在识别命名实体时会产生歧义,导致命名实体识别准确率较低。
[0004]因此,如何提供一种能够进行词义消歧方法,是本领域的技术人员亟需解决的技术问题。

技术实现思路

[0005]有鉴于此,本申请实施例所解决的技术问题之一在于提供一种命名实体识别方法、装置、用于电商平台的命名实体识别方法、装置、案件线索的识别方法、装置、内容识别方法、装置、电子设备及计算机存储介质,用以克服现有技术中由于歧义导致的命名实体识别准确率较低的问题。
[0006]第一方面,本申请实施例提供了一种命名实体识别方法,包括:生成待识别文本对应的基础图,所述基础图包括多个字符节点;获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及所述若干个词语之间的语序关系;从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图以识别所述待识别文本中的命名实体,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接。
[0007]第二方面,本申请实施例提供了一种命名实体识别装置,包括:基础图生成模块,用于生成待识别文本对应的基础图,所述基础图包括多个字符节点;规则确定模块,用于获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及所述若干个词语之间的语序关系;第一字符节点确定模块,用于从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;目标图生成模块,用于根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图以识别所述待识别文本中的命名实体,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接。
[0008]第三方面,本申请实施例提供了一种命名实体识别方法,包括:生成待识别文本对应的基础图,所述基础图包括多个字符节点;获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及所述若干个词语之间的语序关系;从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接;将所述目标图输入图神经网络模型,通过所述图神经网络模型确定所述待识别文本中的各个字符对应的字符编码;将所述字符编码输入命名实体识别模型,通过所述命名实体识别模型识别所述待识别文本中的命名实体。
[0009]第四方面,本申请实施例提供了一种命名实体识别装置,包括:基础图生成模块,用于生成待识别文本对应的基础图,所述基础图包括多个字符节点;规则确定模块,用于获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及所述若干个词语之间的语序关系;第一字符节点确定模块,用于从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;目标图生成模块,用于根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接;图神经网络模块,用于将所述目标图输入图神经网络模型,通过所述图神经网络模型确定所述待识别文本中的各个字符对应的字符编码;命名实体识别模块,用于将所述字符编码输入命名实体识别模型,通过所述命名实体识别模型识别所述待识别文本中的命名实体。
[0010]第五方面,本申请实施例提供了一种用于电商平台的命名实体识别方法,包括:生成用于电商平台的待识别文本对应的基础图,所述基础图包括多个字符节点;获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及若干个所述词语之间的语序关系,所述词语包括品牌名称和/或商品名称;从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图以识别所述待识别文本中的品牌名称和/或商品名称,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接。
[0011]第六方面,本申请实施例提供了一种用于电商平台的命名实体识别装置,包括:基础图生成模块,用于生成用于电商平台的待识别文本对应的基础图,所述基础图包括多个字符节点;规则确定模块,用于获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及若干个所述词语之间的语序关系,所述词语包括品牌名称和/或商品名称;第一字符节点确定模块,用于从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;目标图生成模块,用于根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图以识别所述待识别文本中的品牌名称和/或商品名称,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接。
[0012]第七方面,本申请实施例提供了一种案件线索的识别方法,包括:生成待识别案件文书对应的基础图,所述基础图包括多个字符节点;获取与所述待识别案件文书匹配的词
语搭配规则,所述词语搭配规则包括若干个词语以及若干个所述词语组合为案件线索的语序关系;从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图以识别所述待识别案件文书中的案件线索,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接。
[0013]第八方面,本申请实施例提供了一种案件线索的识别装置,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种命名实体识别方法,包括:生成待识别文本对应的基础图,所述基础图包括多个字符节点;获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及所述若干个词语之间的语序关系;从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图以识别所述待识别文本中的命名实体,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接。2.根据利要求1所述的方法,其中,所述根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中加入用于表征所述词语搭配规则的连接边,包括:根据所述词语搭配规则中的词语之间的语序关系,确定所述若干个第一字符节点的先后顺序;在所述若干个第一字符节点间加入与所述若干个第一字符节点的先后顺序对应的有向边作为所述用于表征所述词语搭配规则的连接边。3.根据权利要求1所述的方法,其中,所述根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中加入用于表征所述词语搭配规则的连接边,包括:根据所述词语搭配规则中的词语,在所述基础图中加入与所述词语搭配规则对应的规则节点;根据所述词语搭配规则中的词语之间的语序关系,通过所述用于表征所述词语搭配规则的连接边,连接所述规则节点与所述若干个第一字符节点。4.根据权利要求3所述的方法,其中,若所述规则节点包括起始规则节点,所述根据所述词语搭配规则中的词语之间的语序关系,通过所述用于表征所述词语搭配规则的连接边,连接所述规则节点与所述若干个第一字符节点,包括:根据所述词语搭配规则中词语之间的语序关系,从所述若干个第一字符节点中确定与所述词语搭配规则中词语的起始字符对应的字符节点;通过所述用于表征所述词语搭配规则的连接边,连接所述起始规则节点与所述起始字符对应的字符节点。5.根据权利要求3所述的方法,其中,若所述规则节点包括结束规则节点,所述根据所述词语搭配规则中的词语之间的语序关系,通过所述用于表征所述词语搭配规则的连接边,连接所述规则节点与所述若干个第一字符节点,包括:根据所述词语搭配规则中词语之间的语序关系,从所述若干个第一字符节点中确定与所述词语搭配规则中词语的结束字符对应的字符节点;通过所述用于表征所述词语搭配规则的连接边,连接所述结束规则节点与所述结束字符对应的字符节点。6.根据权利要求3所述的方法,其中,若所述规则节点包括过渡规则节点,所述根据所述词语搭配规则中的词语之间的语序
关系,通过所述用于表征所述词语搭配规则的连接边,连接所述规则节点与所述若干个第一字符节点,包括:根据所述词语搭配规则中的词语之间的语序关系,从所述词语搭配规则中的词语中确定第一词语和第二词语,其中,所述第一词语与所述第二词语相邻且所述第一词语位于所述第二词语之前;从所述若干个第一字符节点中,确定与所述第一词语的结尾字符对应的字符节点,以及确定与所述第二词语的开始字符对应的字符节点;通过所述用于表征所述词语搭配规则的连接边,连接所述第一词语的结尾字符对应的字符节点与所述过渡规则节点,以及连接所述过渡规则节点与所述第二词语的开始字符对应的字符节点。7.根据权利要求1所述的方法,其中,所述根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,之后,所述方法还包括:根据所述词语搭配规则的使用概率,确定所述用于表征所述词语搭配规则的连接边的权重。8.根据权利要求1所述的方法,其中,所述生成待识别文本对应的基础图,包括:根据所述待识别文本中的字符,确定所述多个字符节点;根据所述待识别文本中的字符间的语序关系,在所述多个字符节点间加入用于表征所述字符间的语序关系的连接边,生成所述基础图。9.根据权利要求1所述的方法,其中,所述生成目标图以识别所述待识别文本中的命名实体,包括:根据所述目标图确定所述待识别文本中的各个字符对应的字符编码;根据所述字符编码识别所述待识别文本中的命名实体。10.一种命名实体识别装置,包括:基础图生成模块,用于生成待识别文本对应的基础图,所述基础图包括多个字符节点;规则确定模块,用于获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及所述若干个词语之间的语序关系;第一字符节点确定模块,用于从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;目标图生成模块,用于根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图以识别所述待识别文本中的命名实体,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接。11.一种命名实体识别方法,包括:生成待识别文本对应的基础图,所述基础图包括多个字符节点;获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及所述若干个词语之间的语序关系;从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;
根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接;将所述目标图输入图神经网络模型,通过所述图神经网络模型确定所述待识别文本中的各个字符对应的字符编码;将所述字符编码输入命名实体识别模型,通过所述命名实体识别模型识别所述待识别文本中的命名实体。12.根据利要求11所述的方法,其中,所述根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中加入用于表征所述词语搭配规则的连接边,包括:根据所述词语搭配规则中的词语之间的语序关系,确定所述若干个第一字符节点的先后顺序;在所述若干个第一字符节点间加入与所述若干个第一字符节点的先后顺序对应的有向边作为所述用于表征所述词语搭配规则的连接边。13.根据权利要求11所述的方法,其中,所述根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中加入用于表征所述词语搭配规则的连接边,包括:根据所述词语搭配规则中的词语,在所述基础图中加入与所述词语搭配规则对应的规则节点;根据所述词语搭配规则中的词语之间的语序关系,通过所述用于表征所述词语搭配规则的连接边,连接所述规则节点与所述若干个第一字符节点。14.根据权利要求11所述的方法,其中,所述根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,之后,所述方法还包括:根据所述词语搭配规则的使用概率,确定所述用于表征所述词语搭配规则的连接边的权重。15.根据权利要求11所述的方法,其中,所述生成待识别文本对应的基础图,包括:根据所述待识别文本中的字符,确定所述多个字符节点;根据所述待识别文本中的字符间的语序关系,在所述多个字符节点间加入用于表征所述字符间的语序关系的连接边,生成所述基础图。16.一种命名实体识别装置,包括:基础图生成模块,用于生成待识别文本对应的基础图,所述基础图包括多个字符节点;规则确定模块,用于获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及所述若干个词语之间的语序关系;第一字符节点确定模块,用于从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;目标图生成模块,用于根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图,其中,所述用于表征所述词语搭配规则的连接边与部分或全部所述若干个第一字符节点连接;图神经网络模块,用于将所述目标图输入图神经网络模型,通过所述图神经网络模型确定所述待识别文本中的各个字符对应的字符编码;
命名实体识别模块,用于将所述字符编码输入命名实体识别模型,通过所述命名实体识别模型识别所述待识别文本中的命名实体。17.一种用于电商平台的命名实体识别方法,包括:生成用于电商平台的待识别文本对应的基础图,所述基础图包括多个字符节点;获取与所述待识别文本匹配的词语搭配规则,所述词语搭配规则包括若干个词语以及若干个所述词语之间的语序关系,所述词语包括品牌名称和/或商品名称;从所述基础图的多个字符节点中确定出与所述词语搭配规则中的词语所对应的若干个第一字符节点;根据所述词语搭配规则中的词语之间的语序关系,在所述基础图中至少加入用于表征所述词语搭配规则的连接边,生成目标图以识别所述待识别文本中的品牌名称和/或商品名称,其中,所述用于表征所述词语搭配规则的...

【专利技术属性】
技术研发人员:丁瑞雪马春平龙定坤徐光伟王潇斌谢朋峻黄非
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1