语句翻译方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:31502078 阅读:28 留言:0更新日期:2021-12-22 23:21
本申请实施例公开了一种语句翻译方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:基于翻译模型、第一样本语句及第二样本语句,获取第一预测结果,获取第三样本语句、第四样本语句及第一样本关系标签,基于翻译模型、第三样本语句及第四样本语句,获取第一预测关系标签,基于第一预测结果、第一预测关系标签及第一样本关系标签,对翻译模型进行调整。本申请实施例提供的方法,在训练翻译模型时,在保证翻译模型具有翻译能力的情况下,提升翻译模型对具有关联关系的语句的分析能力,以便后续基于翻译模型对语句进行翻译时,能够结合翻译模型对具有关联关系的语句的分析能力,从而提升翻译模型的准确率。从而提升翻译模型的准确率。从而提升翻译模型的准确率。

【技术实现步骤摘要】
语句翻译方法、装置、计算机设备及存储介质


[0001]本申请实施例涉及计算机
,特别涉及一种语句翻译方法、装置、计算机设备及存储介质。

技术介绍

[0002]在全球化与信息时代的大背景下,翻译工作的意义重大。随着翻译工作量的日益增多,翻译模型应运而生。与人工翻译相比,翻译模型的效率更高,得到了更为广泛的应用。但是,随着人们对翻译准确率的需求越来越高,如何提高翻译模型的准确率成为了亟需解决的问题。

技术实现思路

[0003]本申请实施例提供了一种语句翻译方法、装置、计算机设备及存储介质,能够提高翻译模型的准确率。所述技术方案如下:
[0004]一方面,提供了一种语句翻译方法,所述方法包括:
[0005]基于翻译模型、第一样本语句及第二样本语句,获取第一预测结果,所述第一预测结果指示基于所述翻译模型将所述第一样本语句翻译成所述第二样本语句的可能性,所述第一样本语句与所述第二样本语句具有相同含义,且所述第一样本语句属于源语言,所述第二样本语句属于目标语言;
[0006]获取第三样本语句、第四样本语句及第一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语句翻译方法,其特征在于,所述方法包括:基于翻译模型、第一样本语句及第二样本语句,获取第一预测结果,所述第一预测结果指示基于所述翻译模型将所述第一样本语句翻译成所述第二样本语句的可能性,所述第一样本语句与所述第二样本语句具有相同含义,且所述第一样本语句属于源语言,所述第二样本语句属于目标语言;获取第三样本语句、第四样本语句及第一样本关系标签,所述第一样本关系标签指示所述第三样本语句与所述第四样本语句之间是否具有关联关系,所述第三样本语句与所述第四样本语句均属于所述源语言;基于所述翻译模型、所述第三样本语句及所述第四样本语句,获取第一预测关系标签,所述第一预测关系标签指示所述第三样本语句与所述第四样本语句之间的预测关联关系;基于所述第一预测结果、所述第一预测关系标签及所述第一样本关系标签,对所述翻译模型进行调整。2.根据权利要求1所述的方法,其特征在于,所述基于所述翻译模型、所述第三样本语句及所述第四样本语句,获取第一预测关系标签,包括:将所述第三样本语句与所述第四样本语句进行拼接,得到第一拼接语句;基于所述翻译模型,对所述第一拼接语句进行编码,得到第一编码特征,所述第一编码特征包括多个第一特征向量,第一个所述第一特征向量与位于所述第一拼接语句之前的起始字符对应,多个所述第一特征向量中除第一个所述第一特征向量以外的每个所述第一特征向量与一个第一词语对应,所述第一词语是指所述第一拼接语句中的词语,每个所述第一特征向量是由所述起始字符的词向量及多个所述第一词语的词向量加权融合得到的;对第一个所述第一特征向量进行分类,得到所述第一预测关系标签。3.根据权利要求2所述的方法,其特征在于,所述第一样本关系标签指示所述第三样本语句与所述第四样本语句是否属于同一组对话;所述对第一个所述第一特征向量进行分类,得到所述第一预测关系标签,包括:基于第一分类模型,对第一个所述第一特征向量进行分类,得到第一预测概率,所述第一预测概率指示所述第三样本语句与所述第四样本语句属于同一组对话的可能性;所述基于所述第一预测结果、所述第一预测关系标签及所述第一样本关系标签,对所述翻译模型进行调整,包括:基于所述第一预测结果,获取第一损失值;基于所述第一预测概率及所述第一样本关系标签,获取第二损失值;基于所述第一损失值及所述第二损失值,对所述翻译模型及所述第一分类模型进行调整。4.根据权利要求2所述的方法,其特征在于,所述第三样本语句与所述第四样本语句属于同一组对话,所述第一样本关系标签指示所述第三样本语句与所述第四样本语句是否由同一个对话者发出;所述对第一个所述第一特征向量进行分类,得到所述第一预测关系标签,包括:基于第二分类模型,对第一个所述第一特征向量进行分类,得到第二预测概率,所述第二预测概率指示所述第三样本语句与所述第四样本语句由同一个对话者发出的可能性;所述基于所述第一预测结果、所述第一预测关系标签及所述第一样本关系标签,对所
述翻译模型进行调整,包括:基于所述第一预测结果,获取第一损失值;基于所述第二预测概率及所述第一样本关系标签,获取第三损失值;基于所述第一损失值及所述第三损失值,对所述翻译模型及所述第二分类模型进行调整。5.根据权利要求2所述的方法,其特征在于,所述基于所述翻译模型,对所述第一拼接语句进行编码,得到第一编码特征,包括:基于所述翻译模型中的特征提取子模型,对所述第一拼接语句进行特征提取,得到第二编码特征,所述第二编码特征包括多个词向量,多个所述词向量包括所述起始字符的词向量及多个所述第一词语的词向量;对于每个所述词向量:基于所述翻译模型中的编码子模型,对多个所述词向量进行加权融合,将加权融合后的向量与所述词向量进行融合,得到所述词向量对应的第一特征向量;将得到的多个所述第一特征向量构成所述第一编码特征。6.根据权利要求1所述的方法,其特征在于,所述基于翻译模型、第一样本语句及第二样本语句,获取第一预测结果,包括:基于所述翻译模型,分别对所述第一样本语句及所述第二样本语句进行编码,得到所述第一样本语句对应的第三编码特征及所述第二样本语句对应的第四编码特征,所述第四编码特征包括每个第二词语对应的第二特征向量,所述第二词语是指所述第二样本语句中的词语,每个所述第二特征向量是由对应的第二词语及之前的第二词语的词向量加权融合得到的;基于所述翻译模型,将所述第三编码特征及所述第四编码特征进行融合,得到融合特征,所述融合特征包括每个所述第二词语对应的融合特征向量;基于所述翻译模型及所述融合特征,获取每个所述第二词语对应的第三预测概率,所述第三预测概率指示基于所述翻译模型将每个所述融合特征向量翻译成对应的第二词语的可能性。7.根据权利要求1所述的方法,其特征在于,所述基于所述第一预测结果、所述第一预测关系标签及所述第一样本关系标签,对所述翻译模型进行调整之后,所述方法还包括:获取第一样本数据集,所述第一样本数据集包括具有相同含义的第一对话数据及第二对话数据,所述第一对话数据属于所述源语言,所述第二对话数据属于所述目标语言,所述第一对话数据和所述第二对话数据均是基...

【专利技术属性】
技术研发人员:周楚伦孟凡东苏劲松
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1