翻译模型的训练方法和装置制造方法及图纸

技术编号:21952815 阅读:17 留言:0更新日期:2019-08-24 17:51
本申请提出一种翻译模型的训练方法和装置,其中,方法包括:获取源语言样本;将源语言样本分别输入模型结构不同的多个翻译模型,以得到各翻译模型输出的目标语言样本;根据各翻译模型输出的目标语言样本,确定目标译文;根据目标译文与各翻译模型输出的目标语言样本之间的差异性,对相应的翻译模型进行训练。该方法能够实现在训练时,利用多个翻译模型进行联合学习,以产生高质量的语音翻译结果,缓解单一模型输出质量较差的问题,提升翻译模型的翻译性能。

Training Method and Device of Translation Model

【技术实现步骤摘要】
翻译模型的训练方法和装置
本申请涉及机器学习
,尤其涉及一种翻译模型的训练方法和装置。
技术介绍
目前,端到端语音翻译模型均采用一个单一模型进行训练,在语音翻译时,利用单一模型将一种语言的语音信号,翻译为另一种语言的文本信息。由于单一模型受限于模型和训练语料的规模,难以产生高质量的翻译结果。
技术实现思路
本申请提出一种翻译模型的训练方法和装置,以实现在训练时,利用多个翻译模型进行联合学习,以产生高质量的语音翻译结果,缓解单一模型输出质量较差的问题,提升翻译模型的翻译性能,用于解决现有技术中单一模型的性能无法得到保障,容易产生质量较差的译文的技术问题。本申请第一方面实施例提出了一种翻译模型的训练方法,包括:获取源语言样本;将所述源语言样本分别输入模型结构不同的多个翻译模型,以得到各翻译模型输出的目标语言样本;根据各翻译模型输出的目标语言样本,确定目标译文;根据所述目标译文与各翻译模型输出的目标语言样本之间的差异性,对相应的翻译模型进行训练。本申请实施例的翻译模型的训练方法,通过获取源语言样本,并将源语言样本分别输入模型结构不同的多个翻译模型,以得到各翻译模型输出的目标语言样本,之后,根据各翻译模型输出的目标语言样本,确定目标译文,最后,根据目标译文与各翻译模型输出的目标语言样本之间的差异性,对相应的翻译模型进行训练。本申请中,根据与多个翻译模型输出结果相关的目标译文,对各翻译模型进行训练,可以实现在训练时,利用多个翻译模型进行联合学习,以产生高质量的语音翻译结果,缓解单一模型输出质量较差的问题,提升翻译模型的翻译性能。本申请第二方面实施例提出了一种翻译模型的训练装置,包括:获取模块,用于获取源语言样本;处理模块,用于将所述源语言样本分别输入模型结构不同的多个翻译模型,以得到各翻译模型输出的目标语言样本;确定模块,用于根据各翻译模型输出的目标语言样本,确定目标译文;训练模块,用于根据所述目标译文与各翻译模型输出的目标语言样本之间的差异性,对相应的翻译模型进行训练。本申请实施例的翻译模型的训练装置,通过获取源语言样本,并将源语言样本分别输入模型结构不同的多个翻译模型,以得到各翻译模型输出的目标语言样本,之后,根据各翻译模型输出的目标语言样本,确定目标译文,最后,根据目标译文与各翻译模型输出的目标语言样本之间的差异性,对相应的翻译模型进行训练。本申请中,根据与多个翻译模型输出结果相关的目标译文,对各翻译模型进行训练,可以实现在训练时,利用多个翻译模型进行联合学习,以产生高质量的语音翻译结果,缓解单一模型输出质量较差的问题,提升翻译模型的翻译性能。本申请第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本申请第一方面实施例提出的翻译模型的训练方法。本申请第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请第一方面实施例提出的翻译模型的训练方法。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本申请实施例一所提供的翻译模型的训练方法的流程示意图;图2为本申请实施例二所提供的翻译模型的训练方法的流程示意图;图3为本申请实施例中翻译模型的训练框架示意图;图4为本申请实施例三所提供的翻译模型的训练装置的结构示意图;图5为本申请实施例四所提供的翻译模型的训练装置的结构示意图;图6示出了适于用来实现本申请实施方式的示例性计算机设备的框图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。本申请主要针对现有技术中单一模型的性能无法得到保障,容易产生质量较差的译文的技术问题,提出一种翻译模型的训练方法。本申请实施例的翻译模型的训练方法,通过利用多个结构不同的翻译模型联合进行学习,能够缓解单一翻译模型带来的缺陷,通过训练时共同学习,能够产生高质量的语音翻译结果。下面参考附图描述本申请实施例的翻译模型的训练方法和装置。图1为本申请实施例一所提供的翻译模型的训练方法的流程示意图。本申请实施例以翻译模型的训练方法被配置于翻译模型的训练装置中来举例说明,该翻译模型的训练装置可以应用于任一计算机设备中,以使该计算机设备可以执行翻译模型的训练功能。其中,计算机设备可以为个人电脑(PersonalComputer,简称PC)、云端设备、移动设备、服务器等,移动设备例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。如图1所示,该翻译模型的训练方法包括以下步骤:步骤101,获取源语言样本。本申请实施例中,源语言样本可以为同一语种的语言样本,或者也可以为不同语种的语言样本,对此不作限制。其中,源语言样本的语种可以根据实际翻译需求进行设置。例如,当翻译模型应用于中译英的应用场景时,源语言样本的语种可以为中文,再例如,当翻译模型应用于英译法的应用场景时,源语言样本的语种可以为英文,又例如,当翻译模型应用于中法互译的应用场景时,源语言样本的语种可以包括中文和/或法文。本申请实施例中,该源语言样本可以为语音形式,或者也可以为文本形式,可以预先采集文本形式的源语言样本和/或语音形式的源语言样本,例如,可以通常的语料收集方式,采集文本形式的源语言样本和/或语音形式的源语言样本,并将采集的文本形式的源语言样本和/或语音形式的源语言样本存储在预设存储装置中。从而,本申请中,在对翻译模型进行训练时,可以从上述存储装置中,获取源语言样本。步骤102,将源语言样本分别输入模型结构不同的多个翻译模型,以得到各翻译模型输出的目标语言样本。本申请实施例中,目标语音样本的语种同样可以根据实际翻译需求进行设置。例如,当翻译模型应用于中译英的应用场景时,源语言样本的语种可以为中文,目标语言样本的语种为英文。又例如,当翻译模型应用于中英互译的应用场景时,源语言样本的语种可以为中文,目标语言样本的语种为英文,或者,源语言样本的语种可以为英文,目标语言样本的语种为中文,或者,源语言样本的语种包括中文和英文,目标语言样本的语种同样可以包括中文和英文。一般情况下,不同的翻译模型需具有一定的差异性,才能达到互相学习的效果。因此,本申请中,多个翻译模型之间模型结构可以存在差异,例如可以为结构不同的Transformer模型、循环神经网络(RecurrentNeuralNetwork,简称RNN)模型、卷积神经网络(ConvolutionalNeuralNetwork,简称CNN)模型等等。本申请实施例中,在获取源语言样本后,可以将源语言样本分别输入至模型结构不同的多个翻译模型,以得到各翻译模型输出的目标语言样本。其中,目标语言样本可以为语音形式,也可以为文本形式,本申请对此并不做限制。步骤103,根据各翻译模型输出的目标语言样本,确定目标译文。本申请实本文档来自技高网...

【技术保护点】
1.一种翻译模型的训练方法,其特征在于,所述训练方法包括以下步骤:获取源语言样本;将所述源语言样本分别输入模型结构不同的多个翻译模型,以得到各翻译模型输出的目标语言样本;根据各翻译模型输出的目标语言样本,确定目标译文;根据所述目标译文与各翻译模型输出的目标语言样本之间的差异性,对相应的翻译模型进行训练。

【技术特征摘要】
1.一种翻译模型的训练方法,其特征在于,所述训练方法包括以下步骤:获取源语言样本;将所述源语言样本分别输入模型结构不同的多个翻译模型,以得到各翻译模型输出的目标语言样本;根据各翻译模型输出的目标语言样本,确定目标译文;根据所述目标译文与各翻译模型输出的目标语言样本之间的差异性,对相应的翻译模型进行训练。2.根据权利要求1所述的训练方法,其特征在于,所述根据所述目标译文与各翻译模型输出的目标语言样本之间的差异性,对相应的翻译模型进行训练之前,还包括:计算所述目标译文与所述源语言样本对应的标准译文之间的误差;确定所述误差小于阈值。3.根据权利要求2所述的训练方法,其特征在于,所述计算所述目标译文与所述源语言样本对应的标准译文之间的误差之后,还包括:若所述误差大于所述阈值,根据所述源语言样本对应的标准译文与各翻译模型输出的目标语言样本之间的差异性,对相应的翻译模型进行训练。4.根据权利要求1-3任一项所述的训练方法,其特征在于,所述根据各翻译模型输出的目标语言样本,确定目标译文,包括:对各翻译模型输出的目标语言样本,确定对应同一文本位置的词分布概率;其中,所述词分布概率,用于指示相应文本位置上为词库中各词的概率;将各目标语言样本对应同一文本位置的词分布概率取平均值,得到所述目标译文中相应文本位置的词分布概率。5.根据权利要求1-3任一项所述的训练方法,其特征在于,所述将所述源语言样本分别输入模型结构不同的多个翻译模型,以得到各翻译模型输出的目标语言样本之前,还包括:根据所述源语言样本和对应的标准译文,对各翻译模型分别进行训练,以使各翻译模型输出的目标语言样本与所述标准译文之间的差异最小化。6.一种翻译模型的训练装置,其特征在于,所述训练装置包括:获取模块,用于...

【专利技术属性】
技术研发人员:毕天驰张传强徐梓翔熊皓何中军李芝
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1