模型训练及命名实体识别方法、装置、设备和存储介质制造方法及图纸

技术编号:35500389 阅读:10 留言:0更新日期:2022-11-09 14:09
本发明专利技术实施例提供一种模型训练及命名实体识别方法、装置、设备和存储介质,该命名实体识别方法包括:确定与待识别的文本对应的命名实体识别模型,命名实体识别模型中包括多个词向量编码网络;通过多个词向量编码网络分别对文本进行词向量编码,以获得文本对应的多组词向量,其中,一组词向量对应于一个词向量编码网络;基于多组词向量识别出文本中包含的命名实体。通过组合多个词向量编码网络的方式,可以获得文本中更加全面而丰富的语义,从而有助于最终提高命名实体识别结果的准确性。于最终提高命名实体识别结果的准确性。于最终提高命名实体识别结果的准确性。

【技术实现步骤摘要】
模型训练及命名实体识别方法、装置、设备和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种模型训练及命名实体识别方法、装置、设备和存储介质。

技术介绍

[0002]命名实体识别是自然语言处理领域中的一个基本问题,属于序列标注问题的范畴。简单来说,命名实体识别问题就是将文本中包含的感兴趣的命名实体识别出来并加以归类,例如人名,地名和机构名等。
[0003]随着神经网络技术的发展,目前,采用神经网络模型来实现命名实体识别已经成为一种主流趋势。在使用神经网络模型进行命名实体识别的过程中,会涉及词向量编码(embedding)的步骤,以将需要识别的文字编码成向量表示。词向量编码结果对命名实体识别结果的准确性具有重要影响。

技术实现思路

[0004]本专利技术实施例提供一种模型训练及命名实体识别方法、装置、设备和存储介质,可以提高命名实体识别结果的准确性。
[0005]第一方面,本专利技术实施例提供一种命名实体识别方法,该方法包括:
[0006]确定与待识别的文本对应的命名实体识别模型,所述命名实体识别模型中包括多个词向量编码网络;
[0007]通过所述多个词向量编码网络分别对所述文本进行词向量编码,以获得所述文本对应的多组词向量,其中,一组词向量对应于一个词向量编码网络;
[0008]基于所述多组词向量,识别出所述文本中包含的命名实体。
[0009]第二方面,本专利技术实施例提供一种命名实体识别装置,该装置包括:
[0010]确定模块,用于确定与待识别的文本对应的命名实体识别模型,所述命名实体识别模型中包括多个词向量编码网络;
[0011]编码模块,用于通过所述多个词向量编码网络分别对所述文本进行词向量编码,以获得所述文本对应的多组词向量,其中,一组词向量对应于一个词向量编码网络;
[0012]识别模块,用于基于所述多组词向量,识别出所述文本中包含的命名实体。
[0013]第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器至少可以实现如第一方面所述的命名实体识别方法。
[0014]第四方面,本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如第一方面所述的命名实体识别方法。
[0015]在上述本专利技术实施例提供的命名实体识别方案中,当需要对某文本进行命名实体识别时,首先确定用于对该文本进行命名实体识别所需使用的命名实体识别模型,该命名
实体识别模型中包括多个词向量编码网络。不同命名实体识别模型中包括的词向量编码网络不完全相同。在使用确定出的命名实体识别模型对上述文本进行命名识别实体的过程中,首先,将文本分别输入到各个词向量编码网络中,以得到每个词向量编码网络输出的一组词向量,这样最终可以得到与多个词向量编码网络对应的多组词向量。之后,基于这多组词向量来识别出上述文本中包含的命名实体。在该方案中,通过组合多个词向量编码网络的方式,可以以不同粒度(或者说维度)来对文本进行词向量表示,获得更加全面而丰富的语义,从而有助于最终提高命名实体识别结果的准确性。
[0016]第五方面,本专利技术实施例提供一种模型训练方法,该方法包括:
[0017]获取已进行命名实体标注的训练文本;
[0018]确定第一词向量编码网络集合,所述第一词向量编码网络集合中包含多个词向量编码网络;
[0019]通过所述第一词向量编码网络集合中包含的多个词向量编码网络分别对所述训练文本进行词向量编码,以获得所述训练文本对应的多组词向量,其中,一组词向量对应于一个词向量编码网络;
[0020]基于通过所述第一词向量编码网络集合得到的多组词向量,训练第一命名实体识别模型,所述第一命名实体识别模型中包括所述第一词向量编码网络集合。
[0021]第六方面,本专利技术实施例提供一种模型训练装置,该装置包括:
[0022]获取模块,用于获取已进行命名实体标注的训练文本;
[0023]确定模块,用于确定第一词向量编码网络集合,所述第一词向量编码网络集合中包含多个词向量编码网络;
[0024]训练模块,用于通过所述第一词向量编码网络集合中包含的多个词向量编码网络分别对所述训练文本进行词向量编码,以获得所述训练文本对应的多组词向量,其中,一组词向量对应于一个词向量编码网络;以及,基于通过所述第一词向量编码网络集合得到的多组词向量,训练第一命名实体识别模型,所述第一命名实体识别模型中包括所述第一词向量编码网络集合。
[0025]第七方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器至少可以实现如第五方面所述的模型训练方法。
[0026]第八方面,本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如第五方面所述的模型训练方法。
[0027]在上述本专利技术实施例提供的模型训练方案中,以标注有命名实体的训练文本来对命名实体识别模型进行训练。被训练的命名实体识别模型中包括多个词向量编码网络,以用于对训练文本进行词向量编码。在训练过程中,首先,将训练文本分别输入到各个词向量编码网络中,以得到每个词向量编码网络输出的一组词向量,这样最终可以得到与多个词向量编码网络对应的多组词向量。之后,基于这多组词向量来训练命名实体识别模型。在该方案中,通过组合多个词向量编码网络的方式,可以以不同粒度(或者说维度)来对文本进行词向量表示,获得更加全面而丰富的语义,从而使得最终训练得到的命名实体识别模型能够具有更好的性能。
附图说明
[0028]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0029]图1为本专利技术实施例提供的一种命名实体识别模型的组成示意图;
[0030]图2为本专利技术实施例提供的另一种命名实体识别模型的组成示意图;
[0031]图3为本专利技术实施例提供的一种模型训练方法的流程图;
[0032]图4为本专利技术实施例提供的一种命名实体识别模型的训练过程示意图;
[0033]图5为本专利技术实施例提供的另一种模型训练方法的流程图;
[0034]图6为本专利技术实施例提供的一种命名实体识别方法的流程图;
[0035]图7为本专利技术实施例提供的一种命名实体识别场景的示意图;
[0036]图8为本专利技术实施例提供的一种模型训练装置的结构示意图;
[0037]图9为与图8所示实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种命名实体识别方法,其特征在于,包括:确定与待识别的文本对应的命名实体识别模型,所述命名实体识别模型中包括多个词向量编码网络;通过所述多个词向量编码网络分别对所述文本进行词向量编码,以获得所述文本对应的多组词向量,其中,一组词向量对应于一个词向量编码网络;基于所述多组词向量,识别出所述文本中包含的命名实体。2.根据权利要求1所述的方法,其特征在于,所述通过所述多个词向量编码网络分别对所述文本进行词向量编码,以获得所述文本对应的多组词向量,包括:对所述文本进行分词处理,以得到所述文本中包含的至少一个词语;将所述至少一个词语分别输入到所述多个词向量编码网络中,以得到所述多个词向量编码网络各自输出的一组词向量,其中,一组词向量中包含所述至少一个词语各自对应的词向量。3.根据权利要求2所述的方法,其特征在于,所述基于所述多组词向量,识别出所述文本中包含的命名实体,包括:通过对所述多组词向量中对应于同一词语的多个词向量进行拼接,以得到所述文本对应的目标组词向量;基于所述目标组词向量,识别出所述文本中包含的命名实体;其中,所述目标组词向量中与目标词语对应的目标词向量,由所述多组词向量中对应于所述目标词语的多个词向量拼接得到,所述目标词语是所述至少一个词语中的任一个。4.根据权利要求1所述的方法,其特征在于,所述确定与待识别的文本对应的命名实体识别模型,包括:根据所述文本的属性信息,确定所述命名实体识别模型。5.根据权利要求1所述的方法,其特征在于,所述多个词向量编码网络分别对应于不同的编码粒度。6.一种模型训练方法,其特征在于,包括:获取已进行命名实体标注的训练文本;确定第一词向量编码网络集合,所述第一词向量编码网络集合中包含多个词向量编码网络;通过所述第一词向量编码网络集合中包含的多个词向量编码网络分别对所述训练文本进行词向量编码,以获得所述训练文本对应的多组词向量,其中,一组词向量对应于一个词向量编码网络;基于通过所述第一词向量编码网络集合得到的多组词向量,训练第一命名实体识别模型,所述第一命名实体识别模型中包括所述第一词...

【专利技术属性】
技术研发人员:蒋勇王涛黄忠强黄非
申请(专利权)人:阿里巴巴新加坡控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1