实体词语的识别方法以及装置制造方法及图纸

技术编号:35922954 阅读:13 留言:0更新日期:2022-12-10 11:09
本发明专利技术公开了一种实体词语的识别方法以及装置。其中,该方法包括:确定目标文本集合;获取多个不同的初始识别模型,多个不同的初始识别模型分别对应的多个初始层级;基于目标文本集合中的训练文本集合,采用多个不同的初始识别模型分别对应的多个初始层级进行交互训练,得到多个不同的第一识别模型;基于目标文本集合中的验证文本集合,采用多个不同的第一识别模型分别对应的多个初始层级进行交互验证,得到多个不同的目标识别模型;基于多个不同的目标识别模型,确定待识别文本对应的目标实体词语识别结果。本发明专利技术解决了相关技术中采用多个模型进行实体词语识别的方法存在的模型交互效果差,进而导致实体词语识别准确性低的技术问题。的技术问题。的技术问题。

【技术实现步骤摘要】
实体词语的识别方法以及装置


[0001]本专利技术涉及命名实体识别
,具体而言,涉及一种实体词语的识别方法以及装置。

技术介绍

[0002]在人工智能(Natural Language Processing,NLP)领域,存在众多的模型用以挖掘文本的不同特征。例如,1维的卷积神经网络网络(Convolutional Neural Networks,CNN)可以识别文本序列的片段显著特征,循环神经网络(Recurrent Neural Network,RNN)可以识别文本的顺序特征,自注意力Attention模型可以识别不同文字的重要程度等。这些模型可以从不同的角度对文本进行编码,如何合理的应用这些模型以获得更好的命名实体识别结果,就变得至关重要。
[0003]集成学习是通过组合多个学习器来完成学习任务通过集成方法,可以将多个弱学习器组合成一个强分类器(即将采用多模型组合识别的方进行命名实体识别),因此集成学习的泛化能力一般比单一分类器要好。但是现有技术中主要基于多个模型输出结果的组合识别,多个模型间交互效果较差,进而导致实体词语识别准确性低。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种实体词语的识别方法以及装置,以至少解决相关技术中采用多个模型进行实体词语识别的方法存在的模型交互效果差,进而导致实体词语识别准确性低的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种实体词语的识别方法,包括:确定目标文本集合,其中,上述目标文本集合包括训练文本集合和验证文本集合;获取多个不同的初始识别模型,上述多个不同的初始识别模型分别对应的多个初始层级;基于上述训练文本集合,采用上述多个不同的初始识别模型分别对应的上述多个初始层级进行交互训练,得到多个不同的第一识别模型;基于上述验证文本集合,采用上述多个不同的第一识别模型分别对应的多个第一层级进行交互验证,得到多个不同的目标识别模型;基于上述多个不同的目标识别模型,确定待识别文本对应的目标实体词语识别结果。
[0007]可选的,上述基于上述训练文本集合,采用上述多个不同的初始识别模型分别对应的上述多个初始层级进行交互训练,得到多个不同的第一识别模型,包括:基于上述训练文本集合,采用上述多个不同的初始识别模型分别对应的上述多个初始层级进行交互训练,得到上述多个不同的初始识别模型分别输出的第一训练结果;根据上述第一训练结果,确定上述多个不同的初始识别模型对应的模型总损失;基于上述模型总损失对上述多个不同的初始识别模型进行参数更新,得到更新后的多个不同的初始识别模型;将上述更新后的多个不同的初始识别模型作为新的上述多个不同的初始识别模型,循环执行以下操作,直至达到预设迭代次数:基于上述训练文本集合,采用新的上述多个不同的初始识别模型
分别对应的新的上述多个初始层级进行交互训练,得到新的上述多个不同的初始识别模型分别输出的新的上述第一训练结果;根据新的上述第一训练结果,确定新的上述多个不同的初始识别模型对应的新的上述模型总损失;基于新的上述模型总损失对新的上述多个不同的初始识别模型进行参数更新,得到新的上述更新后的多个不同的初始识别模型;将上述预设迭代次数中最后一次迭代操作对应的上述更新后的多个不同的初始识别模型作为上述多个不同的第一识别模型。
[0008]可选的,在上述多个初始层级包括初始底层级、初始中间层级以及初始末端层级的情况下,上述基于上述训练文本集合,采用上述多个不同的初始识别模型分别对应的上述多个初始层级进行交互训练,得到上述多个不同的初始识别模型分别输出的第一训练结果,包括:获取上述训练文本集合中目标数量的训练文本,将上述目标数量的训练文本分别输入至上述多个不同的初始识别模型分别对应的上述初始底层级,得到上述多个不同的初始识别模型分别对应的底层训练结果;对上述多个不同的初始识别模型分别对应的上述底层训练结果进行两两交互处理,得到上述多个不同的初始识别模型分别对应的处理后的底层训练结果;将上述处理后的底层训练结果输入至对应的上述初始中间层级,得到上述多个不同的初始识别模型分别对应的中间层训练结果;对上述多个不同的初始识别模型分别对应的上述中间层训练结果进行两两上述交互处理,得到上述多个不同的初始识别模型分别对应的处理后的中间层训练结果;将上述处理后的中间层训练结果输入至对应的上述初始末端层级,得到上述多个不同的初始识别模型分别对应的末端层训练结果;对上述多个不同的初始识别模型分别对应的上述末端层训练结果进行两两上述交互处理,得到上述多个不同的初始识别模型分别对应的处理后的末端层训练结果;基于上述多个不同的初始别模型分别对应的上述处理后的末端层训练结果,得到上述第一训练结果。
[0009]可选的,上述根据上述第一训练结果,确定上述多个不同的初始识别模型对应的模型总损失,包括:获取上述训练文本集合对应的真实实体词语;根据上述多个不同的初始识别模型分别输出的上述第一训练结果,以及上述真实实体词语,确定上述多个不同的初始识别模型分别对应的模型损失;基于上述多个不同的初始识别模型分别对应的模型损失,得到上述多个不同的初始识别模型对应的上述模型总损失。
[0010]可选的,上述基于上述多个不同的目标识别模型,确定待识别文本对应的目标实体词语识别结果,包括:获取上述待识别文本;基于上述待识别文本,采用上述多个不同的目标识别模型进行交互测试,得到上述多个不同的目标识别模型分别输出的第一实体词语识别结果;确定上述第一实体词语识别结果对应的第一权重值;基于上述多个不同的目标识别模型分别对应的上述第一实体词语识别结果,以及上述第一权重值,得到上述目标实体词语识别结果。
[0011]可选的,上述确定上述多个不同的目标识别模型分别对应的第一权重值,包括:基于上述验证文本集合,采用上述多个不同的第一识别模型分别对应的多个第一层级进行交互验证,得到上述多个不同的第一识别模型分别输出的第一验证结果;获取上述训练文本集合对应的真实实体词语;根据上述多个不同的第一识别模型分别输出的上述第一验证结果和上述真实实体词语,确定上述第一权重值。
[0012]可选的,上述交互处理为以下任意之一:内积处理,加权求和处理以及拼接处理。
[0013]根据本专利技术实施例的另一方面,还提供了一种实体词语的识别装置,包括:第一确
定模块,用于确定目标文本集合,其中,上述目标文本集合包括训练文本集合和验证文本集合;第一获取模块,用于获取多个不同的初始识别模型,上述多个不同的初始识别模型分别对应的多个初始层级;第二获取模块,用于基于上述训练文本集合,采用上述多个不同的初始识别模型分别对应的上述多个初始层级进行交互训练,得到多个不同的第一识别模型;第三获取模块,用于基于上述验证文本集合,采用上述多个不同的第一识别模型分别对应的多个第一层级进行交互验证,得到多个不同的目标识别模型;第二确定模块,用于基于上述多个不同的目标识别模型,确定待识别文本对应的目标实体词语识别结果。
[001本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实体词语的识别方法,其特征在于,包括:确定目标文本集合,其中,所述目标文本集合包括训练文本集合和验证文本集合;获取多个不同的初始识别模型,所述多个不同的初始识别模型分别对应的多个初始层级;基于所述训练文本集合,采用所述多个不同的初始识别模型分别对应的所述多个初始层级进行交互训练,得到多个不同的第一识别模型;基于所述验证文本集合,采用所述多个不同的第一识别模型分别对应的多个第一层级进行交互验证,得到多个不同的目标识别模型;基于所述多个不同的目标识别模型,确定待识别文本对应的目标实体词语识别结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述训练文本集合,采用所述多个不同的初始识别模型分别对应的所述多个初始层级进行交互训练,得到多个不同的第一识别模型,包括:基于所述训练文本集合,采用所述多个不同的初始识别模型分别对应的所述多个初始层级进行交互训练,得到所述多个不同的初始识别模型分别输出的第一训练结果;根据所述第一训练结果,确定所述多个不同的初始识别模型对应的模型总损失;基于所述模型总损失对所述多个不同的初始识别模型进行参数更新,得到更新后的多个不同的初始识别模型;将所述更新后的多个不同的初始识别模型作为新的所述多个不同的初始识别模型,循环执行以下操作,直至达到预设迭代次数:基于所述训练文本集合,采用新的所述多个不同的初始识别模型分别对应的新的所述多个初始层级进行交互训练,得到新的所述多个不同的初始识别模型分别输出的新的所述第一训练结果;根据新的所述第一训练结果,确定新的所述多个不同的初始识别模型对应的新的所述模型总损失;基于新的所述模型总损失对新的所述多个不同的初始识别模型进行参数更新,得到新的所述更新后的多个不同的初始识别模型;将所述预设迭代次数中最后一次迭代操作对应的所述更新后的多个不同的初始识别模型作为所述多个不同的第一识别模型。3.根据权利要求2所述的方法,其特征在于,在所述多个初始层级包括初始底层级、初始中间层级以及初始末端层级的情况下,所述基于所述训练文本集合,采用所述多个不同的初始识别模型分别对应的所述多个初始层级进行交互训练,得到所述多个不同的初始识别模型分别输出的第一训练结果,包括:获取所述训练文本集合中目标数量的训练文本,将所述目标数量的训练文本分别输入至所述多个不同的初始识别模型分别对应的所述初始底层级,得到所述多个不同的初始识别模型分别对应的底层训练结果;对所述多个不同的初始识别模型分别对应的所述底层训练结果进行两两交互处理,得到所述多个不同的初始识别模型分别对应的处理后的底层训练结果;将所述处理后的底层训练结果输入至对应的所述初始中间层级,得到所述多个不同的初始识别模型分别对应的中间层训练结果;对所述多个不同的初始识别模型分别对应的所述中间层训练结果进行两两所述交互处理,得到所述多个不同的初始识别模型分别对应的处理后的中间层训练结果;
将所述处理后的中间层训练结果输入至对应的所述初始末端层级,得到所述多个不同的初始识别模型分别对应的末端层训练结果;对所述...

【专利技术属性】
技术研发人员:于翠楠
申请(专利权)人:南京燧坤智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1