训练评分模型的方法、装置、终端及存储介质制造方法及图纸

技术编号：31575241 阅读：10 留言：0更新日期：2021-12-25 11:16

本申请公开了一种训练评分模型的方法、装置、终端及存储介质，属于互联网技术领域。该方法包括：获取样本原文、第一样本译文以及至少一个第二样本译文，其中，第一样本译文的语义和样本原文对应的语义相同，第二样本译文的语义与第一样本译文的语义不同；将样本原文和第一样本译文输入评分模型，得到第一样本译文对应的第一样本分数，将样本原文分别和每个第二样本译文输入评分模型，得到每个第二样本译文对应的第二样本分数；基于第一样本分数以及至少一个第二样本分数，确定损失信息；基于损失信息，对评分模型进行调整。可见，本申请实施例解决了在没有样本译文对应的基准分数下，无法对评分模型进行训练的问题。对评分模型进行训练的问题。对评分模型进行训练的问题。

全部详细技术资料下载

【技术实现步骤摘要】
训练评分模型的方法、装置、终端及存储介质

[0001]本申请涉及互联网
，特别涉及一种训练评分模型的方法、装置、终端及存储介质。

技术介绍

[0002]随着科学技术的发展，对机器翻译的译文进行评价，变得尤其的重要。
[0003]在相关技术中，将原文和对应的译文输入训练完成的评分模型，得到该译文对应的分数，进而基于该分数对该译文进行评价。对训练完成的评分模型进行训练的过程为：获取训练样本集，每个训练样本包括样本原文、对应的样本译文以及预先标注的基准分数。将训练样本中的样本原文和样本译文输入评分模型，得到该样本原文对应的预测分数。基于预测分数和基准分数，对评分模型进行训练调整。
[0004]在上述过程中，基准分数是专业翻译者对样本原文和对应的样本译文进行评分得来的。一旦训练样本缺少对应的基准分数，则无法对评分模型进行训练。

技术实现思路

[0005]本申请实施例提供了一种训练评分模型的方法、装置、终端及存储介质，解决了在没有样本译文对应的基准分数下，无法对评分模型进行训练的问题。该技术方案如下：
[0006]第一方面，本申请实施例提供了一种训练评分模型的方法，该方法包括：
[0007]获取样本原文、第一样本译文以及至少一个第二样本译文，其中，所述第一样本译文的语义和所述样本原文的语义相同，所述第二样本译文的语义与所述第一样本译文的语义不同；
[0008]将所述样本原文和所述第一样本译文输入评分模型，得到所述第一样本译文对应的第一样本分数，将所述样本原文分别和每...

【技术保护点】

【技术特征摘要】
1.一种训练评分模型的方法，其特征在于，所述方法包括：获取样本原文、第一样本译文以及至少一个第二样本译文，其中，所述第一样本译文的语义和所述样本原文的语义相同，所述第二样本译文的语义与所述第一样本译文的语义不同；将所述样本原文和所述第一样本译文输入评分模型，得到所述第一样本译文对应的第一样本分数，将所述样本原文分别和每个第二样本译文输入评分模型，得到每个第二样本译文对应的第二样本分数；基于所述第一样本分数以及至少一个第二样本分数，确定损失信息；基于所述损失信息，对评分模型进行调整。2.根据权利要求1所述的方法，其特征在于，所述获取样本原文、第一样本译文以及至少一个第二样本译文之前，所述方法还包括：获取所述第一样本译文对应的第一样本文本向量和高斯噪声向量；将所述第一样本文本向量和所述高斯噪声向量相加，得到加噪之后的第一样本文本向量；将加噪之后的第一样本文本向量和所述第一样本文本向量输入预先训练的去噪自编码器，得到所述第二样本译文。3.根据权利要求1所述的方法，其特征在于，所述获取样本原文、第一样本译文以及至少一个第二样本译文之前，所述方法还包括：获取所述第一样本文本对应的第一样本文本向量；对所述第一样本译文进行随机破坏，得到破坏之后的第一样本译文；确定所述破坏之后的第一样本译文对应的第二样本文本向量；将所述第一样本文本向量和所述第二样本文本向量输入预先训练的去噪自编码器，得到所述第二样本译文。4.根据权利要求1所述的方法，其特征在于，所述基于所述第一样本分数以及至少一个第二样本分数，确定损失信息，包括：基于所述第一样本分数、所述至少一个第二样本分数以及第一预设公式，确定所述损失信息；所述第一预设公式为L＝∑
x∈D
‑
(p
x
×
log(W
x
×
h(x))+(1
‑
p
x
)
×
log(1
‑
W
x
×
h(x)))；其中，L为所述损失信息，D为由所述第一样本译文和所述至少一个第二样本译文组成的样本译文集合，x为所述样本译文集合D中的任一样本译文，h(x)为所述样本译文x对应的分数，W
x
为预设系数，p
x
为预设常数...

【专利技术属性】
技术研发人员：徐金安，黄辉，狄慧，刘健，陈钰枫，
申请(专利权)人：东芝中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人