一种语言生成模型改进方法技术

技术编号：39772875 阅读：8 留言：0更新日期：2023-12-22 02:22

本申请公开了一种语言生成模型改进方法

全部详细技术资料下载

【技术实现步骤摘要】
一种语言生成模型改进方法、系统、设备及存储介质

[0001]本申请涉及计算机
，特别是涉及一种语言生成模型改进方法
、
系统
、
设备及存储介质
。

技术介绍

[0002]传统生成模型是根据输入模型的训练文本生成对应的输出文本，传统生成模型的监督训练方式中模型是根据预先设置的标准答案，逐个字符去计算训练文本的损失函数
loss
，这样的训练过程依赖于有限的训练数据，无法根据实际情况选择输出实际场景中什么词是符合语境的，可能会造成输出输出内容与当前语境不符的情况，以至于传统生成模型的泛化性和生成质量较差
。
[0003]因此，如何提高生成模型的生成质量，是本领域技术人员亟待解决的技术问题
。

技术实现思路

[0004]基于上述问题，本申请提供了一种语言生成模型改进方法
、
系统
、
设备及存储介质，用以提高生成模型的生成质量
。
[0005]为解决上述问题，本申请实施例提供的技术方案如下：
[0006]本申请第一方面提供了一种语言生成模型改进方法，包括：
[0007]获取训练文本；
[0008]将所述训练文本输入语言生成模型，确定输出文本；
[0009]将所述输出文本输入评价模型，确定评价信息；
[0010]基于所述输出文本和所述评价信息对所述语言生成模型进行训练，直到模型收敛并达到预设性能要求
。
[0011]可选...

【技术保护点】

【技术特征摘要】
1.
一种语言生成模型改进方法，其特征在于，包括：获取训练文本；将所述训练文本输入语言生成模型，确定输出文本；将所述输出文本输入评价模型，确定评价信息；基于所述输出文本和所述评价信息对所述语言生成模型进行训练，直到模型收敛并达到预设性能要求
。2.
根据权利要求1所述的方法，其特征在于，所述将所述输出文本输入评价模型，确定评价信息；对所述输出文本进行切分得到若干个词；获取每个切分得到的词对应的字符级评价信息和对所述输出文本的句段级评价信息
。3.
根据权利要求2所述的方法，其特征在于，所述基于所述输出文本和所述评价信息对所述语言生成模型进行训练，直到模型收敛并达到预设性能要求，包括：获取目标文本，所述目标文本包括符合预设条件的评价信息对应的词；对获取到的目标文本进行映射，得到所述输出文本对应的映射结果；基于所述映射结果和标准样本确定所述训练文本的损失值；基于计算得到的损失值迭代训练所述语言生成模型，直到模型收敛并达到预设性能要求
。4.
根据权利要求3所述的方法，其特征在于，所述映射结果为所述目标文本对应的词序列，所述基于所述映射结果和标准样本确定所述训练文本的损失值，包括：获取目标文本中每个词对应的概率分布；基于获取到的概率分布和所述标准样本计算得到所述训练文本对应的损失值
。5.
根据权利要求1所述的方法，其特征在于，所述将所述训练文本输入语言生成模型，确定输出文本，包括：对所述训练文本包括的各个词进行映射，得到所述训练文本对应的词序列；基于所述训练文本对应的词序列对所述训练文本包括的各个词进行预测，得到所述词序列对应...

【专利技术属性】
技术研发人员：张士杰，
申请(专利权)人：太保科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人