模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：39142177 阅读：7 留言：0更新日期：2023-10-23 14:55

本发明专利技术公开了一种模型训练方法、装置、电子设备及存储介质。其中，该模型训练包括：基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器；训练样本集中的训练样本设置有设定类别标签；生成器的训练样本为真实文本，判别器的训练样本为真实文本和生成器生成的扩充文本；判别器的判别结果包括：对扩充文本的类别判定结果，以及对扩充文本的真伪判定结果；确定生成对抗网络模型满足训练结束条件，得到训练好的生成对抗网络模型。得到训练好的生成对抗网络模型。得到训练好的生成对抗网络模型。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、电子设备及存储介质

[0001]本专利技术涉及计算机
，尤其涉及一种模型训练方法、装置、电子设备及存储介质。

技术介绍

[0002]训练一个识别准确率高的模型需要大量的有标签的样本数据，针对有限的样本数据，提高模型的识别准确率的方法是对样本数据进行数据增强操作。相关技术通过回译、同义词替换、随机插入、随机交换和随机删除等方法来对样本数据进行数据增强，但是上述方法有可能会破坏原始文本结构，导致生成负样本。

技术实现思路

[0003]有鉴于此，本专利技术实施例提供了一种模型训练方法、装置、电子设备及存储介质，旨在实现样本数据的可控生成。
[0004]本专利技术实施例的技术方案是这样实现的：
[0005]一方面，本专利技术实施例提供了一种模型训练方法，该方法包括：
[0006]基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器；所述训练样本集中的训练样本设置有设定类别标签；所述生成器的训练样本为真实文本，所述判别器的训练样本为所述真实文本和所述生成器生成的扩充文本；所述判别器的判别结果包括：对所述扩充文本的类别判定结果，以及对所述扩充文本的真伪判定结果；
[0007]确定所述生成对抗网络模型满足训练结束条件，得到训练好的生成对抗网络模型。
[0008]在上述方案中，所述基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器之前，所述方法还包括：
[0009]基于第一损失函数预训练所述判别器；所述第一损失函数包括真伪判定损失函数...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法包括：基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器；所述训练样本集中的训练样本设置有设定类别标签；所述生成器的训练样本为真实文本，所述判别器的训练样本为所述真实文本和所述生成器生成的扩充文本；所述判别器的判别结果包括：对所述扩充文本的类别判定结果，以及对所述扩充文本的真伪判定结果；确定所述生成对抗网络模型满足训练结束条件，得到训练好的生成对抗网络模型。2.根据权利要求1所述的方法，其特征在于，所述基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器之前，所述方法还包括：基于第一损失函数预训练所述判别器；所述第一损失函数包括真伪判定损失函数和分类判定损失函数；基于第二损失函数预训练所述生成器。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：在所述生成对抗网络模型每一轮迭代训练后，基于所述生成器生成的扩充文本计算文本评价指标BLEU值；所述确定所述生成对抗网络模型满足训练结束条件，包括：若连续两轮迭代训练对应的BLEU值的差值小于设定值，确定所述生成对抗网络模型满足所述训练结束条件。4.根据权利要求1所述的方法，其特征在于，所述基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器，包括：在训练所述判别器时，获取所述判别器对所述真实文本和所述生成器生成的扩充文本的判别结果；基于所述判别结果更新所述判别器的第三损失函数；基于更新后的所述第三损失函数，重新训练所述判别器。5.根据权利要求1所述的方法，其特征在于，所述基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器，包括：在训练所述生成器时，基于所述生成器生成所述扩充文本；基于所述扩充文本确定设定价值函数的值；所述设定价值函数的值表征所述判别器对所述扩充文本的判别结果；基于所述价值函数的值，更新所述生成器的第四损失函数；基于更新后的所述第四损失函数，重新训练所述生成器。6.根据权利要求5所述的方法，其特征在于，所述基于所述扩充文本确定设定价值函数的值，包括：在所述生成器生成所述扩充文本的每个字或词时，基于关键字生成算法补全所述扩充文本的后续内容；基于每个字或词对应的补全的扩充文本，确定对应的设定价值函数的值。7.根据权利要求6所述的方法，其特征在于，所述基于所述价值函数的值，更新所述生成器的第四损失函数，包括：基于所述每个字或词对应的设定价值函数的值，更新所述生成器的第四损失函数；或，确...

【专利技术属性】
技术研发人员：胡威，黄毅，冯俊兰，邓超，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人