一种语言生成模型改进方法技术

技术编号:39772875 阅读:8 留言:0更新日期:2023-12-22 02:22
本申请公开了一种语言生成模型改进方法

【技术实现步骤摘要】
一种语言生成模型改进方法、系统、设备及存储介质


[0001]本申请涉及计算机
,特别是涉及一种语言生成模型改进方法

系统

设备及存储介质


技术介绍

[0002]传统生成模型是根据输入模型的训练文本生成对应的输出文本,传统生成模型的监督训练方式中模型是根据预先设置的标准答案,逐个字符去计算训练文本的损失函数
loss
,这样的训练过程依赖于有限的训练数据,无法根据实际情况选择输出实际场景中什么词是符合语境的,可能会造成输出输出内容与当前语境不符的情况,以至于传统生成模型的泛化性和生成质量较差

[0003]因此,如何提高生成模型的生成质量,是本领域技术人员亟待解决的技术问题


技术实现思路

[0004]基于上述问题,本申请提供了一种语言生成模型改进方法

系统

设备及存储介质,用以提高生成模型的生成质量

[0005]为解决上述问题,本申请实施例提供的技术方案如下:
[0006]本申请第一方面提供了一种语言生成模型改进方法,包括:
[0007]获取训练文本;
[0008]将所述训练文本输入语言生成模型,确定输出文本;
[0009]将所述输出文本输入评价模型,确定评价信息;
[0010]基于所述输出文本和所述评价信息对所述语言生成模型进行训练,直到模型收敛并达到预设性能要求

[0011]可选的,所述将所述输出文本输入评价模型,确定评价信息;
[0012]对所述输出文本进行切分得到若干个词;
[0013]获取每个切分得到的词对应的字符级评价信息和对所述输出文本的句段级评价信息

[0014]可选的,所述基于所述输出文本和所述评价信息对所述语言生成模型进行训练,直到模型收敛并达到预设性能要求,包括:
[0015]获取目标文本,所述目标文本包括符合预设条件的评价信息对应的词;
[0016]对获取到的目标文本进行映射,得到所述输出文本对应的映射结果;
[0017]基于所述映射结果和标准样本确定所述训练文本的损失值;
[0018]基于计算得到的损失值迭代训练所述语言生成模型,直到模型收敛并达到预设性能要求

[0019]可选的,所述映射结果为所述目标文本对应的词序列,所述基于所述映射结果和标准样本确定所述训练文本的损失值,包括:
[0020]获取目标文本中每个词对应的概率分布;
[0021]基于获取到的概率分布和所述标准样本计算得到所述训练文本对应的损失值

[0022]可选的,所述将所述训练文本输入语言生成模型,确定输出文本,包括:
[0023]对所述训练文本包括的各个词进行映射,得到所述训练文本对应的词序列;
[0024]基于所述训练文本对应的词序列对所述训练文本包括的各个词进行预测,得到所述词序列对应的输出文本

[0025]本申请第二方面提供了一种语言生成模型改进系统,包括:
[0026]训练文本获取单元,用于获取训练文本;
[0027]输出文本确定单元,用于将所述训练文本输入语言生成模型,确定输出文本;
[0028]评价信息确定单元,用于将所述输出文本输入评价模型,确定评价信息;
[0029]训练模型,用于基于所述输出文本和所述评价信息对所述语言生成模型进行训练,直到模型收敛并达到预设性能要求

[0030]可选的,所述评价信息确定单元具体用于对所述输出文本进行切分得到若干个词;获取每个切分得到的词对应的字符级评价信息和对所述输出文本的句段级评价信息

[0031]可选的,所述训练单元包括:
[0032]目标文本获取单元,获取目标文本,所述目标文本包括符合预设条件的评价信息对应的词;
[0033]映射单元,用于对获取到的目标文本进行映射,得到所述输出文本对应的映射结果;
[0034]损失值确定单元,用于基于所述映射结果和标准样本确定所述训练文本的损失值;
[0035]迭代单元,用于基于计算得到的损失值迭代训练所述语言生成模型,直到模型收敛并达到预设性能要求

[0036]本申请第三方面提供了一种电子设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现前述第一方面中任一项所述的语言生成模型改进方法

[0037]本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如前述第一方面中任意一项所述的语言生成模型改进方法

[0038]相较于现有技术,本申请具有以下有益效果:
[0039]本申请通过获取训练文本;将所述训练文本输入语言生成模型,确定输出文本;将所述输出文本输入评价模型,确定评价信息;基于所述输出文本和所述评价信息对所述语言生成模型进行训练,直到模型收敛并达到预设性能要求

在传统的标准答案监督训练的基础上,引入偏好评价模型给语言生成模型生成的文本进行评价

基于输出的文本和对该文本的评价信息迭代完成最终的模型训练

使语言生成模型实现自我迭代训练,鼓励模型从多样的角度生成内容,不只是依赖输入的训练样本,从而可以使模型具有更好的生成质量和泛化性

附图说明
[0040]为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术
描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0041]图1为本申请实施例所提供的一种语言生成模型改进方法流程图;
[0042]图2为本申请实施例提供的评价模型应用示意图;
[0043]图3为本申请实施例提供的模型训练示意图;
[0044]图4为本申请实施例所提供的一种语言生成模型改进系统结构图;
[0045]图5为本申请实施例提供的一种计算机设备的结构示意图

具体实施方式
[0046]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例

基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围

[0047]为便于理解本申请实施例提供的技术方案,下面将先对本申请实施例涉及的
技术介绍
进行说明本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种语言生成模型改进方法,其特征在于,包括:获取训练文本;将所述训练文本输入语言生成模型,确定输出文本;将所述输出文本输入评价模型,确定评价信息;基于所述输出文本和所述评价信息对所述语言生成模型进行训练,直到模型收敛并达到预设性能要求
。2.
根据权利要求1所述的方法,其特征在于,所述将所述输出文本输入评价模型,确定评价信息;对所述输出文本进行切分得到若干个词;获取每个切分得到的词对应的字符级评价信息和对所述输出文本的句段级评价信息
。3.
根据权利要求2所述的方法,其特征在于,所述基于所述输出文本和所述评价信息对所述语言生成模型进行训练,直到模型收敛并达到预设性能要求,包括:获取目标文本,所述目标文本包括符合预设条件的评价信息对应的词;对获取到的目标文本进行映射,得到所述输出文本对应的映射结果;基于所述映射结果和标准样本确定所述训练文本的损失值;基于计算得到的损失值迭代训练所述语言生成模型,直到模型收敛并达到预设性能要求
。4.
根据权利要求3所述的方法,其特征在于,所述映射结果为所述目标文本对应的词序列,所述基于所述映射结果和标准样本确定所述训练文本的损失值,包括:获取目标文本中每个词对应的概率分布;基于获取到的概率分布和所述标准样本计算得到所述训练文本对应的损失值
。5.
根据权利要求1所述的方法,其特征在于,所述将所述训练文本输入语言生成模型,确定输出文本,包括:对所述训练文本包括的各个词进行映射,得到所述训练文本对应的词序列;基于所述训练文本对应的词序列对所述训练文本包括的各个词进行预测,得到所述词序列对应...

【专利技术属性】
技术研发人员:张士杰
申请(专利权)人:太保科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1