模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39142177 阅读:7 留言:0更新日期:2023-10-23 14:55
本发明专利技术公开了一种模型训练方法、装置、电子设备及存储介质。其中,该模型训练包括:基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器;训练样本集中的训练样本设置有设定类别标签;生成器的训练样本为真实文本,判别器的训练样本为真实文本和生成器生成的扩充文本;判别器的判别结果包括:对扩充文本的类别判定结果,以及对扩充文本的真伪判定结果;确定生成对抗网络模型满足训练结束条件,得到训练好的生成对抗网络模型。得到训练好的生成对抗网络模型。得到训练好的生成对抗网络模型。

【技术实现步骤摘要】
模型训练方法、装置、电子设备及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种模型训练方法、装置、电子设备及存储介质。

技术介绍

[0002]训练一个识别准确率高的模型需要大量的有标签的样本数据,针对有限的样本数据,提高模型的识别准确率的方法是对样本数据进行数据增强操作。相关技术通过回译、同义词替换、随机插入、随机交换和随机删除等方法来对样本数据进行数据增强,但是上述方法有可能会破坏原始文本结构,导致生成负样本。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供了一种模型训练方法、装置、电子设备及存储介质,旨在实现样本数据的可控生成。
[0004]本专利技术实施例的技术方案是这样实现的:
[0005]一方面,本专利技术实施例提供了一种模型训练方法,该方法包括:
[0006]基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器;所述训练样本集中的训练样本设置有设定类别标签;所述生成器的训练样本为真实文本,所述判别器的训练样本为所述真实文本和所述生成器生成的扩充文本;所述判别器的判别结果包括:对所述扩充文本的类别判定结果,以及对所述扩充文本的真伪判定结果;
[0007]确定所述生成对抗网络模型满足训练结束条件,得到训练好的生成对抗网络模型。
[0008]在上述方案中,所述基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器之前,所述方法还包括:
[0009]基于第一损失函数预训练所述判别器;所述第一损失函数包括真伪判定损失函数和分类判定损失函数;
[0010]基于第二损失函数预训练所述生成器。
[0011]在上述方案中,所述方法还包括:
[0012]在所述生成对抗网络模型每一轮迭代训练后,基于所述生成器生成的扩充文本计算文本评价指标BLEU值;
[0013]所述确定所述生成对抗网络模型满足训练结束条件,包括:
[0014]若连续两轮迭代训练对应的BLEU值的差值小于设定值,确定所述生成对抗网络模型满足所述训练结束条件。
[0015]在上述方案中,所述基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器,包括:
[0016]在训练所述判别器时,获取所述判别器对所述真实文本和所述生成器生成的扩充文本的判别结果;
[0017]基于所述判别结果更新所述判别器的第三损失函数;
[0018]基于更新后的所述第三损失函数,重新训练所述判别器。
[0019]在上述方案中,所述基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器,包括:
[0020]在训练所述生成器时,基于所述生成器生成所述扩充文本;
[0021]基于所述扩充文本确定设定价值函数的值;所述设定价值函数的值表征所述判别器对所述扩充文本的判别结果;
[0022]基于所述价值函数的值,更新所述生成器的第四损失函数;
[0023]基于更新后的所述第四损失函数,重新训练所述生成器。
[0024]在上述方案中,所述基于所述扩充文本确定设定价值函数的值,包括:
[0025]在所述生成器生成所述扩充文本的每个字或词时,基于关键字生成算法补全所述扩充文本的后续内容;
[0026]基于每个字或词对应的补全的扩充文本,确定对应的设定价值函数的值。
[0027]在上述方案中,所述基于所述价值函数的值,更新所述生成器的第四损失函数,包括:
[0028]基于所述每个字或词对应的设定价值函数的值,更新所述生成器的第四损失函数;或,
[0029]确定所述扩充文本中的所有字或词对应的设定价值函数的值的平均值,基于所述平均值更新所述生成器的第四损失函数。
[0030]另一方面,本专利技术实施例提供了一种样本数据增强方法,该方法包括:
[0031]将设定类别标签输入所述生成对抗网络模型中的生成器;所述生成对抗网络模型包括所述生成器和判别器;所述生成对抗网络模型基于训练样本集训练得到,所述训练样本集中的训练样本设置有所述设定类别标签;所述生成器的训练样本为真实文本,所述判别器的训练样本为所述真实文本和所述生成器生成的扩充文本;所述判别器的判别结果包括对所述扩充文本的类别判定结果,以及对所述扩充文本的真伪判定结果;
[0032]获取所述生成器输出的与所述设定类别标签对应的样本数据。
[0033]另一方面,本专利技术实施例提供了一种模型训练装置,该装置包括:
[0034]训练模块,用于基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器;所述训练样本集中的训练样本设置有设定类别标签;所述生成器的训练样本为真实文本,所述判别器的训练样本为所述真实文本和所述生成器生成的扩充文本;所述判别器的判别结果包括:对所述扩充文本的类别判定结果,以及对所述扩充文本的真伪判定结果;
[0035]确定模块,用于确定所述生成对抗网络模型满足训练结束条件,得到训练好的生成对抗网络模型。
[0036]另一方面,本专利技术实施例提供了一种样本数据增强装置,该装置包括:
[0037]输入模块,用于将设定类别标签输入所述生成对抗网络模型中的生成器;所述生成对抗网络模型包括所述生成器和判别器;所述生成对抗网络模型基于训练样本集训练得到,所述训练样本集中的训练样本设置有所述设定类别标签;所述生成器的训练样本为真实文本,所述判别器的训练样本为所述真实文本和所述生成器生成的扩充文本;所述判别器的判别结果包括对所述扩充文本的类别判定结果,以及对所述扩充文本的真伪判定结
果;
[0038]获取模块,用于获取所述生成器输出的与所述设定类别标签对应的样本数据。
[0039]另一方面,本专利技术实施例提供了一种电子设备,包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行本专利技术实施例第一方面提供的模型训练方法的步骤或第二方面提供的样本数据增强方法的步骤。
[0040]另一方面,本专利技术实施例提供了一种计算机可读存储介质,包括:所述计算机可读存储介质存储有计算机程序。所述计算机程序被处理器执行时实现如本专利技术实施例第一方面提供的模型训练方法的步骤或第二方面提供的样本数据增强方法的步骤。
[0041]本专利技术实施例基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器,确定所述对抗网络模型满足训练结束条件,得到训练好的生成对抗网络模型。其中,训练样本集中的训练样本设置有设定类别标签,生成器的训练样本为真实文本,判别器的训练样本为真实文本和生成器生成的扩充文本,判别器的判别结果包括对扩充文本的类别判定结果,以及对扩充文本的真伪判定结果。本专利技术实施例通过生成器和判别器的对抗训练,可以使生成器学习骚扰电话文本的语义信息,使得生成器能够生成类别更加准确、内容更加逼真的样本数据,保证数据增强后的样本数据与原样本数据语义一致。并将设定类别标签作为生成器的输入条件,使其可以控制生成文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器;所述训练样本集中的训练样本设置有设定类别标签;所述生成器的训练样本为真实文本,所述判别器的训练样本为所述真实文本和所述生成器生成的扩充文本;所述判别器的判别结果包括:对所述扩充文本的类别判定结果,以及对所述扩充文本的真伪判定结果;确定所述生成对抗网络模型满足训练结束条件,得到训练好的生成对抗网络模型。2.根据权利要求1所述的方法,其特征在于,所述基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器之前,所述方法还包括:基于第一损失函数预训练所述判别器;所述第一损失函数包括真伪判定损失函数和分类判定损失函数;基于第二损失函数预训练所述生成器。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述生成对抗网络模型每一轮迭代训练后,基于所述生成器生成的扩充文本计算文本评价指标BLEU值;所述确定所述生成对抗网络模型满足训练结束条件,包括:若连续两轮迭代训练对应的BLEU值的差值小于设定值,确定所述生成对抗网络模型满足所述训练结束条件。4.根据权利要求1所述的方法,其特征在于,所述基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器,包括:在训练所述判别器时,获取所述判别器对所述真实文本和所述生成器生成的扩充文本的判别结果;基于所述判别结果更新所述判别器的第三损失函数;基于更新后的所述第三损失函数,重新训练所述判别器。5.根据权利要求1所述的方法,其特征在于,所述基于训练样本集迭代训练生成对抗网络模型中的生成器和判别器,包括:在训练所述生成器时,基于所述生成器生成所述扩充文本;基于所述扩充文本确定设定价值函数的值;所述设定价值函数的值表征所述判别器对所述扩充文本的判别结果;基于所述价值函数的值,更新所述生成器的第四损失函数;基于更新后的所述第四损失函数,重新训练所述生成器。6.根据权利要求5所述的方法,其特征在于,所述基于所述扩充文本确定设定价值函数的值,包括:在所述生成器生成所述扩充文本的每个字或词时,基于关键字生成算法补全所述扩充文本的后续内容;基于每个字或词对应的补全的扩充文本,确定对应的设定价值函数的值。7.根据权利要求6所述的方法,其特征在于,所述基于所述价值函数的值,更新所述生成器的第四损失函数,包括:基于所述每个字或词对应的设定价值函数的值,更新所述生成器的第四损失函数;或,确...

【专利技术属性】
技术研发人员:胡威黄毅冯俊兰邓超
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1