实体识别模型训练方法、装置、设备及实体识别方法制造方法及图纸

技术编号：32325346 阅读：23 留言：0更新日期：2022-02-16 18:32

本申请涉及一种实体识别模型训练方法、装置、设备及实体识别方法。该方法包括：利用第一训练样本训练初始模型，得到预训练模型，其中预训练模型用于自然语言处理；根据预训练模型建立初始多任务模型，初始多任务模型用于执行分词任务和实体识别任务；通过目标损失函数与第二训练样本对初始多任务模型进行训练得到目标多任务模型，目标损失函数用于联合分词任务和实体识别任务；将目标训练样本输入目标多任务模型，得到目标多任务模型输出的分词表示向量，以及目标多任务模型中的预训练模型输出的字向量和位置表示向量；利用分词表示向量、字向量和位置表示向量训练实体识别模型，得到目标模型。本申请解决了中文字词的实体识别准确度较低的问题。确度较低的问题。确度较低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
实体识别模型训练方法、装置、设备及实体识别方法

[0001]本申请涉及智能识别
，尤其涉及一种实体识别模型训练方法、装置、设备及实体识别方法。

技术介绍

[0002]相关技术的实体识别方法，无法解决中文字词边界模糊的问题，中文与英文的边界标识不相同，英文有明显的空格和一些独特的形式标志，例如首字母大写等作为英文的边界标识，但是，中文字词没有像英文那样明显的切分标志，导致中文字词的前后边界模糊不容易确定，分词不准确。因为，分词任务与实体识别任务是相互影响的，而相关技术中没有考虑到分词任务与实体识别任务之间的关系，导致影响实体识别模型对中文字词进行实体识别的准确度。

技术实现思路

[0003]本申请提供了一种实体识别模型训练方法、装置、设备及计算机可读存储介质，以解决相关技术中没有考虑到分词任务与实体识别任务之间的关系，导致影响实体识别模型对中文字词进行实体识别的准确度的问题。
[0004]第一方面，本申请提供了一种实体识别模型训练方法，利用第一训练样本训练初始模型，得到预训练模型，其中预训练模型用于自然语言处理；根据预训练模型建立初始多任务模型，初始多任务模型用于执行分词任务和实体识别任务；通过目标损失函数与第二训练样本对初始多任务模型进行训练，得到目标多任务模型；将目标训练样本输入目标多任务模型，得到目标多任务模型输出的分词表示向量，以及目标多任务模型中的预训练模型输出的字向量和位置表示向量；利用分词表示向量、字向量和位置表示向量训练实体识别模型，得到目标模型

【技术保护点】

【技术特征摘要】
1.一种实体识别模型训练方法，其特征在于，包括：利用第一训练样本训练初始模型，得到预训练模型，其中所述预训练模型用于自然语言处理；根据所述预训练模型建立初始多任务模型，所述初始多任务模型用于执行分词任务和实体识别任务；通过目标损失函数与第二训练样本对所述初始多任务模型进行训练，得到目标多任务模型，所述目标损失函数用于联合所述分词任务和所述实体识别任务；将目标训练样本输入所述目标多任务模型，得到所述目标多任务模型输出的分词表示向量，以及所述目标多任务模型中的预训练模型输出的字向量和位置表示向量；利用所述分词表示向量、所述字向量和所述位置表示向量训练实体识别模型，得到目标模型。2.根据权利要求1所述的实体识别模型训练方法，其特征在于，根据所述预训练模型建立初始多任务模型，包括：将所述预训练模型分别与第一任务层和第二任务层连接，得到初始多任务模型，所述第一任务层用于执行所述实体识别任务，所述第二任务层用于执行所述分词任务。3.根据权利要求2所述的实体识别模型训练方法，其特征在于，通过目标损失函数与第二训练样本对所述初始多任务模型进行训练，得到目标多任务模型包括：通过所述第二训练样本对所述初始多任务模型进行训练；当所述目标损失函数的损失值达到阈值时，判定所述初始多任务模型训练完成，得到所述目标多任务模型；所述目标损失函数为，其中，Loss表示目标损失函数的损失值，loss1表示实体识别任务的损失值，loss2表示分词任务的损失值，Step表示训练初始多任务模型的总次数，i表示当前的训练次数。4.根据权利要求3所述的实体识别模型训练方法，其特征在于，通过目标损失函数与第二训练样本对所述初始多任务模型进行训练，还包括：通过更新所述第二训练样本对所述初始多任务模型的分词任务进行训练；当所述分词任务的损失值满足目标损失阈值时，通过更新所述第二训练样本对所述初始多任务模型的实体识别任务进行训练。5.根据权利要求1
‑
4任意一项所述的实体识别模型训练方法，其特征在于，利用所述分词表示向量、所述字向量和所述位置表示向量训练实体识别模型，得到目标模型...

【专利技术属性】
技术研发人员：刘伟硕，
申请(专利权)人：北京明略软件系统有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人