翻译方法、装置、电子设备以及计算机可读存储介质制造方法及图纸

技术编号:38669145 阅读:19 留言:0更新日期:2023-09-02 22:48
本申请实施例提供了一种翻译方法、装置、电子设备以及计算机可读存储介质,涉及人工智能、自然语言处理、多媒体及云技术领域。该方法包括:获取源语言的待翻译文本,通过训练好的翻译模型对待翻译文本进行翻译,得到待翻译文本对应于目标语言的目标文本;该翻译模型是通过以下方式训练得到的:获取包括源语言的第一文本和第一文本对应于目标语言的第二文本的多个训练样本;根据每个样本的第一文本和第二文本中相匹配的各单词对在两个文本中的位置偏置,确定每个样本对应的训练损失权重;基于多个样本及其对应的训练损失权重对初始神经网络模型进行迭代训练得到翻译模型。基于该方法,能够有效提升翻译效果。能够有效提升翻译效果。能够有效提升翻译效果。

【技术实现步骤摘要】
翻译方法、装置、电子设备以及计算机可读存储介质


[0001]本申请涉及人工智能、自然语言处理、多媒体及云
,具体而言,本申请实施例涉及一种翻译方法、装置、电子设备、计算机可读存储介质以及计算机程序产品。

技术介绍

[0002]随着人工智能技术的快速发展,越来越多的人工技能技术被应用于文本翻译领域,通过翻译模型可以将一种语言的文本翻译为另一种语言的文本,基于人工智能技术的自动化翻译技术已经被广泛应用到越来越多的场景中,比如,人们日常生活中,可以采用在线翻译软件满足翻译需求,再比如,可以采用同步机器翻译(SiMT,Simultaneous Machine Translation)模型进行同步翻译,SiMT模型可以从不完整的源文本开始阅读,并逐步产生翻译,它旨在以最低的延迟和最高的质量将连续输入的文本流翻译成另一种语言,可以满足同步翻译的需求。
[0003]目前,相关技术中已经存在多种多样的翻译模型,对于模型的训练,通常都是采用包括源文本和翻译文本的文本对模型进行不断的训练,直至满足一定的条件。虽然现有技术中训练得到的翻译模型能够一定程度上满足应用需求,但是模型的翻译性能仍有待提升。

技术实现思路

[0004]本申请实施例的目的旨在提供一种能够有效提升翻译效果的翻译方法、装置、电子设备以及计算机可读存储介质。为了实现该目的,本申请实施例提供的技术方案如下:
[0005]一方面,本申请实施例提供了一种翻译方法,该方法包括:
[0006]获取源语言的待翻译文本;
[0007]通过调用训练好的翻译模型对待翻译文本进行翻译,得到待翻译文本对应于目标语言的目标文本;其中,翻译模型是通过以下方式训练得到的:
[0008]获取多个训练样本,每个训练样本包括源语言的第一文本和第一文本对应于目标语言的第二文本;
[0009]对于每个训练样本,根据该训练样本的第一文本和第二文本中相匹配的各单词对在两个文本中的位置偏置,确定该训练样本对应的训练损失权重;
[0010]基于多个训练样本和各训练样本对应的训练损失权重,对初始神经网络模型进行迭代训练,得到翻译模型;其中,在训练过程中,一个训练样本对应的训练损失是基于该训练样本对应的训练损失权重确定的。
[0011]另一方面,本申请实施例提供了一种翻译装置,该装置包括:
[0012]文本获取模块,用于获取源语言的待翻译文本;
[0013]文本翻译模块,用于通过调用训练好的翻译模型对待翻译文本进行翻译,得到待翻译文本对应于目标语言的目标文本;其中,翻译模型是由模型训练装置通过以下方式训练得到的:
[0014]获取多个训练样本,每个训练样本包括源语言的第一文本和第一文本对应于目标语言的第二文本;
[0015]对于每个训练样本,根据该训练样本的第一文本和第二文本中相匹配的各单词对在两个文本中的位置偏置,确定该训练样本对应的训练损失权重;
[0016]基于多个训练样本和各训练样本对应的训练损失权重,对初始神经网络模型进行迭代训练,得到翻译模型;其中,在训练过程中,一个训练样本对应的训练损失是基于该训练样本对应的训练损失权重确定的。
[0017]可选的,模型训练装置在对初始神经网络模型进行迭代训练时可以用于:
[0018]将每个训练样本的第一文本分别输入至神经网络模型中,得到每个训练样本的第一文本对应于目标语言的翻译结果;
[0019]对于每个训练样本,根据该训练样本的第二文本和对应的翻译结果之间的差异、以及该训练样本对应的训练损失权重,确定该训练样本对应的训练损失;
[0020]基于各训练样本对应的训练损失,得到神经网络模型对应的训练总损失;
[0021]基于训练总损失对神经网络模型的模型参数进行调整,并基于多个训练样本和各训练样本对应的训练损失权重对调整后的神经网络模型继续进行训练。
[0022]可选的,一个训练样本中的一个相匹配的单词对包括该训练样本的第一文本中的源端单词、以及该训练样本的第二文本中与该源端单词相匹配的目标端单词;对于每个训练样本,模型训练装置在根据该训练样本的第一文本和第二文本中相匹配的各单词对在两个文本中的位置偏置,确定该训练样本对应的训练损失权重时,可以用于:
[0023]对于该训练样本中的每个相匹配的单词对,根据该单词对中的源端单词和目标端单词之间的位置偏置(即源端单词在该训练样本的第一文本中的位置与目标端单词在该训练样本的第二文本中的位置之间的偏置),确定该单词对对应的对齐偏置;
[0024]对于该训练样本中的每个目标端单词,根据该训练样本中包括该目标端单词的各个相匹配的单词对对应的对齐偏置,确定该目标端单词对应的对齐偏置;
[0025]基于该训练样本中的各目标端单词对应的对齐偏置,确定该训练样本对应的训练损失权重。
[0026]可选的,对于训练样本中的每个相匹配的单词对,模型训练装置在根据该单词对中的源端单词和目标端单词之间的位置偏置,确定该单词对对应的对齐偏置时,可以用于:
[0027]若该单词对中的源端单词和目标端单词之间的位置偏置大于或等于第一设定值,根据该位置偏置与第一设定值之间的差值,确定该单词对对应的对齐偏置,其中,该单词对对应的对齐偏置与对应的位置偏置成正相关;
[0028]若该单词对中的源端单词和目标端单词之间的位置偏置小于第一设定值,将该单词对对应的对齐偏置确定为第一预设值。
[0029]可选的,对于每个训练样本中的每个目标端单词,模型训练装置在根据该训练样本中包括该目标端单词的各个相匹配的单词对对应的对齐偏置,确定该目标端单词对应的对齐偏置时,可以用于:将该训练样本中包括该目标端单词的各个相匹配的单词对对应的对齐偏置的均值,确定为目标端单词对应的对齐偏置。
[0030]可选的,模型训练装置在基于训练样本中的各目标端单词对应的对齐偏置,确定训练样本对应的训练损失权重时,可以用于:
[0031]对于训练样本中每个目标端单词,基于该目标端单词对应的对齐偏置,确定该目标端单词对应的训练损失权重;基于该训练样本中的各目标端单词对应的训练损失权重,得到该训练样本对应的训练损失权重。
[0032]可选的,对于训练样本中每个目标端单词,模型训练装置在基于该目标端单词对应的对齐偏置,确定该目标端单词对应的训练损失权重时,可以用于:
[0033]若该目标端单词对应的对齐偏置大于或等于第二设定值,将该目标端单词对应的训练损失权重确定为第二预设值;
[0034]若该目标端单词对应的对齐偏置小于第二设定值,根据该目标端单词对应的对齐偏置,确定该目标端单词对应的训练损失权重,其中,一个目标端单词对应的训练损失权重与该目标端单词对应的对齐偏置成负相关。
[0035]可选地,一个训练样本的第一文本对应于目标语言的翻译结果,包括该第一文本中各源端单词对应于目标语言的翻译结果;模型训练装置在基于训练样本中的各目标端单词对应的训练损失权重,得到训练样本对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种翻译方法,其特征在于,包括:获取源语言的待翻译文本;通过调用训练好的翻译模型对所述待翻译文本进行翻译,得到所述待翻译文本对应于目标语言的目标文本;其中,所述翻译模型是通过以下方式训练得到的:获取多个训练样本,每个所述训练样本包括源语言的第一文本和所述第一文本对应于目标语言的第二文本;对于每个所述训练样本,根据所述训练样本的第一文本和第二文本中相匹配的各单词对在两个文本中的位置偏置,确定所述训练样本对应的训练损失权重;基于所述多个训练样本和各所述训练样本对应的训练损失权重,对初始神经网络模型进行迭代训练,得到所述翻译模型;其中,在训练过程中,一个所述训练样本对应的训练损失是基于所述训练样本对应的训练损失权重确定的。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个训练样本和各所述训练样本对应的训练损失权重,对初始神经网络模型进行迭代训练,包括:将每个所述训练样本的第一文本分别输入至所述神经网络模型中,得到每个所述训练样本的第一文本对应于所述目标语言的翻译结果;对于每个所述训练样本,根据所述训练样本的第二文本和对应的翻译结果之间的差异、以及所述训练样本对应的训练损失权重,确定所述训练样本对应的训练损失;基于各所述训练样本对应的训练损失,得到所述神经网络模型对应的训练总损失;基于所述训练总损失对所述神经网络模型的模型参数进行调整,并基于所述多个训练样本和各所述训练样本对应的训练损失权重对调整后的神经网络模型继续进行训练。3.根据权利要求2所述的方法,其特征在于,一个所述训练样本中的一个相匹配的单词对,包括所述训练样本的第一文本中的源端单词、以及所述训练样本的第二文本中与该源端单词相匹配的目标端单词;对于每个所述训练样本,所述根据所述训练样本的第一文本和第二文本中相匹配的各单词对在两个文本中的位置偏置,确定所述训练样本对应的训练损失权重,包括:对于所述训练样本中的每个相匹配的单词对,根据该单词对中的源端单词和目标端单词之间的位置偏置,确定该单词对对应的对齐偏置;对于所述训练样本中的每个目标端单词,根据所述训练样本中包括该目标端单词的各个相匹配的单词对对应的对齐偏置,确定该目标端单词对应的对齐偏置;基于所述训练样本中的各目标端单词对应的对齐偏置,确定所述训练样本对应的训练损失权重。4.根据权利要求3所述的方法,其特征在于,对于所述训练样本中的每个相匹配的单词对,所述根据该单词对中的源端单词和目标端单词之间的位置偏置,确定该单词对对应的对齐偏置,包括:若该单词对中的源端单词和目标端单词之间的位置偏置大于或等于第一设定值,根据所述位置偏置与所述第一设定值之间的差值,确定该单词对对应的对齐偏置,其中,该单词对对应的对齐偏置与所述位置偏置成正相关;若该单词对中的源端单词和目标端单词之间的位置偏置小于所述第一设定值,将该单
词对对应的对齐偏置确定为第一预设值。5.根据权利要求3所述的方法,其特征在于,对于所述训练样本中的每个目标端单词,所述根据所述训练样本中包括该目标端单词的各个相匹配的单词对对应的对齐偏置,确定该目标端单词对应的对齐偏置,包括:将所述训练样本中包括该目标端单词的各个相匹配的单词对对应的对齐偏置的均值,确定为所述目标端单词对应的对齐偏置。6.根据权利要求3所述的方法,其特征在于,所述基于所述训练样本中的各目标端单词对应的对齐偏置,确定所述训练样本对应的训练损失权重,包括:对于所述训练样本中每个目标端单词,基于所述目标端单词对应的对齐偏置,确定所述目标端单词对应的训练损失权重;基于所述训练样本中的各目标端单词对应的训练损失权重,得到所述训练样本对应的训练损失权重。7.根据权利要求6所述的方法,其特征在于,对于所述训练样本中每个目标端单词,所述基于所述目标端单词对应的对齐偏置,确定所述目标端单词对应的训练损失权重,包括:若所述目标端单词对应的对齐偏置大于或等于第二设定值,将所述目标端单词对应的训练损失权重确定为第二预设值;若所述目标端单词对应的对齐偏置小于所述第二设定值,根据...

【专利技术属性】
技术研发人员:梁棋棋刘宜进孟凡东陈钰枫徐金安
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1