实体词语的识别方法以及装置制造方法及图纸

技术编号：35922954 阅读：13 留言：0更新日期：2022-12-10 11:09

本发明专利技术公开了一种实体词语的识别方法以及装置。其中，该方法包括：确定目标文本集合；获取多个不同的初始识别模型，多个不同的初始识别模型分别对应的多个初始层级；基于目标文本集合中的训练文本集合，采用多个不同的初始识别模型分别对应的多个初始层级进行交互训练，得到多个不同的第一识别模型；基于目标文本集合中的验证文本集合，采用多个不同的第一识别模型分别对应的多个初始层级进行交互验证，得到多个不同的目标识别模型；基于多个不同的目标识别模型，确定待识别文本对应的目标实体词语识别结果。本发明专利技术解决了相关技术中采用多个模型进行实体词语识别的方法存在的模型交互效果差，进而导致实体词语识别准确性低的技术问题。的技术问题。的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
实体词语的识别方法以及装置

[0001]本专利技术涉及命名实体识别
，具体而言，涉及一种实体词语的识别方法以及装置。

技术介绍

[0002]在人工智能(Natural Language Processing，NLP)领域，存在众多的模型用以挖掘文本的不同特征。例如，1维的卷积神经网络网络(Convolutional Neural Networks，CNN)可以识别文本序列的片段显著特征，循环神经网络(Recurrent Neural Network，RNN)可以识别文本的顺序特征，自注意力Attention模型可以识别不同文字的重要程度等。这些模型可以从不同的角度对文本进行编码，如何合理的应用这些模型以获得更好的命名实体识别结果，就变得至关重要。
[0003]集成学习是通过组合多个学习器来完成学习任务通过集成方法，可以将多个弱学习器组合成一个强分类器(即将采用多模型组合识别的方进行命名实体识别)，因此集成学习的泛化能力一般比单一分类器要好。但是现有技术中主要基于多个模型输出结果的组合识别，多个模型间交互效果较差，进而导致实体词语识别准确性低。
[0004]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种实体词语的识别方法以及装置，以至少解决相关技术中采用多个模型进行实体词语识别的方法存在的模型交互效果差，进而导致实体词语识别准确性低的技术问题。
[0006]根据本专利技术实施例的一个方面，提供了一种实体词语的识别方法，包括...

【技术保护点】

【技术特征摘要】
1.一种实体词语的识别方法，其特征在于，包括：确定目标文本集合，其中，所述目标文本集合包括训练文本集合和验证文本集合；获取多个不同的初始识别模型，所述多个不同的初始识别模型分别对应的多个初始层级；基于所述训练文本集合，采用所述多个不同的初始识别模型分别对应的所述多个初始层级进行交互训练，得到多个不同的第一识别模型；基于所述验证文本集合，采用所述多个不同的第一识别模型分别对应的多个第一层级进行交互验证，得到多个不同的目标识别模型；基于所述多个不同的目标识别模型，确定待识别文本对应的目标实体词语识别结果。2.根据权利要求1所述的方法，其特征在于，所述基于所述训练文本集合，采用所述多个不同的初始识别模型分别对应的所述多个初始层级进行交互训练，得到多个不同的第一识别模型，包括：基于所述训练文本集合，采用所述多个不同的初始识别模型分别对应的所述多个初始层级进行交互训练，得到所述多个不同的初始识别模型分别输出的第一训练结果；根据所述第一训练结果，确定所述多个不同的初始识别模型对应的模型总损失；基于所述模型总损失对所述多个不同的初始识别模型进行参数更新，得到更新后的多个不同的初始识别模型；将所述更新后的多个不同的初始识别模型作为新的所述多个不同的初始识别模型，循环执行以下操作，直至达到预设迭代次数：基于所述训练文本集合，采用新的所述多个不同的初始识别模型分别对应的新的所述多个初始层级进行交互训练，得到新的所述多个不同的初始识别模型分别输出的新的所述第一训练结果；根据新的所述第一训练结果，确定新的所述多个不同的初始识别模型对应的新的所述模型总损失；基于新的所述模型总损失对新的所述多个不同的初始识别模型进行参数更新，得到新的所述更新后的多个不同的初始识别模型；将所述预设迭代次数中最后一次迭代操作对应的所述更新后的多个不同的初始识别模型作为所述多个不同的第一识别模型。3.根据权利要求2所述的方法，其特征在于，在所述多个初始层级包括初始底层级、初始中间层级以及初始末端层级的情况下，所述基于所述训练文本集合，采用所述多个不同的初始识别模型分别对应的所述多个初始层级进行交互训练，得到所述多个不同的初始识别模型分别输出的第一训练结果，包括：获取所述训练文本集合中目标数量的训练文本，将所述目标数量的训练文本分别输入至所述多个不同的初始识别模型分别对应的所述初始底层级，得到所述多个不同的初始识别模型分别对应的底层训练结果；对所述多个不同的初始识别模型分别对应的所述底层训练结果进行两两交互处理，得到所述多个不同的初始识别模型分别对应的处理后的底层训练结果；将所述处理后的底层训练结果输入至对应的所述初始中间层级，得到所述多个不同的初始识别模型分别对应的中间层训练结果；对所述多个不同的初始识别模型分别对应的所述中间层训练结果进行两两所述交互处理，得到所述多个不同的初始识别模型分别对应的处理后的中间层训练结果；
将所述处理后的中间层训练结果输入至对应的所述初始末端层级，得到所述多个不同的初始识别模型分别对应的末端层训练结果；对所述...

【专利技术属性】
技术研发人员：于翠楠，
申请(专利权)人：南京燧坤智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人