翻译模型的训练方法和装置制造方法及图纸

技术编号：21952815 阅读：17 留言：0更新日期：2019-08-24 17:51

本申请提出一种翻译模型的训练方法和装置，其中，方法包括：获取源语言样本；将源语言样本分别输入模型结构不同的多个翻译模型，以得到各翻译模型输出的目标语言样本；根据各翻译模型输出的目标语言样本，确定目标译文；根据目标译文与各翻译模型输出的目标语言样本之间的差异性，对相应的翻译模型进行训练。该方法能够实现在训练时，利用多个翻译模型进行联合学习，以产生高质量的语音翻译结果，缓解单一模型输出质量较差的问题，提升翻译模型的翻译性能。

Training Method and Device of Translation Model

全部详细技术资料下载

【技术实现步骤摘要】
翻译模型的训练方法和装置
本申请涉及机器学习
，尤其涉及一种翻译模型的训练方法和装置。
技术介绍
目前，端到端语音翻译模型均采用一个单一模型进行训练，在语音翻译时，利用单一模型将一种语言的语音信号，翻译为另一种语言的文本信息。由于单一模型受限于模型和训练语料的规模，难以产生高质量的翻译结果。
技术实现思路
本申请提出一种翻译模型的训练方法和装置，以实现在训练时，利用多个翻译模型进行联合学习，以产生高质量的语音翻译结果，缓解单一模型输出质量较差的问题，提升翻译模型的翻译性能，用于解决现有技术中单一模型的性能无法得到保障，容易产生质量较差的译文的技术问题。本申请第一方面实施例提出了一种翻译模型的训练方法，包括：获取源语言样本；将所述源语言样本分别输入模型结构不同的多个翻译模型，以得到各翻译模型输出的目标语言样本；根据各翻译模型输出的目标语言样本，确定目标译文；根据所述目标译文与各翻译模型输出的目标语言样本之间的差异性，对相应的翻译模型进行训练。本申请实施例的翻译模型的训练方法，通过获取源语言样本，并将源语言样本分别输入模型结构不同的多个翻译模型，以得到各翻译模型输出的目标语言样本，之后，根据各翻译模型输出的目标语言样本，确定目标译文，最后，根据目标译文与各翻译模型输出的目标语言样本之间的差异性，对相应的翻译模型进行训练。本申请中，根据与多个翻译模型输出结果相关的目标译文，对各翻译模型进行训练，可以实现在训练时，利用多个翻译模型进行联合学习，以产生高质量的语音翻译结果，缓解单一模型输出质量较差的问题，提升翻译模型的翻译性能。本申请第二方面实施例提出了一种翻译模...

【技术保护点】
1.一种翻译模型的训练方法，其特征在于，所述训练方法包括以下步骤：获取源语言样本；将所述源语言样本分别输入模型结构不同的多个翻译模型，以得到各翻译模型输出的目标语言样本；根据各翻译模型输出的目标语言样本，确定目标译文；根据所述目标译文与各翻译模型输出的目标语言样本之间的差异性，对相应的翻译模型进行训练。

【技术特征摘要】
1.一种翻译模型的训练方法，其特征在于，所述训练方法包括以下步骤：获取源语言样本；将所述源语言样本分别输入模型结构不同的多个翻译模型，以得到各翻译模型输出的目标语言样本；根据各翻译模型输出的目标语言样本，确定目标译文；根据所述目标译文与各翻译模型输出的目标语言样本之间的差异性，对相应的翻译模型进行训练。2.根据权利要求1所述的训练方法，其特征在于，所述根据所述目标译文与各翻译模型输出的目标语言样本之间的差异性，对相应的翻译模型进行训练之前，还包括：计算所述目标译文与所述源语言样本对应的标准译文之间的误差；确定所述误差小于阈值。3.根据权利要求2所述的训练方法，其特征在于，所述计算所述目标译文与所述源语言样本对应的标准译文之间的误差之后，还包括：若所述误差大于所述阈值，根据所述源语言样本对应的标准译文与各翻译模型输出的目标语言样本之间的差异性，对相应的翻译模型进行训练。4.根据权利要求1-3任一项所述的训练方法，其特征在于，所述根据各翻译模型输出的目标语言样本，确定目标译文，包括：对各翻译模型输出的目标语言样本，确定对应同一文本位置的词分布概率；其中，所述词分布概率，用于指示相应文本位置上为词库中各词的概率；将各目标语言样本对应同一文本位置的词分布概率取平均值，得到所述目标译文中相应文本位置的词分布概率。5.根据权利要求1-3任一项所述的训练方法，其特征在于，所述将所述源语言样本分别输入模型结构不同的多个翻译模型，以得到各翻译模型输出的目标语言样本之前，还包括：根据所述源语言样本和对应的标准译文，对各翻译模型分别进行训练，以使各翻译模型输出的目标语言样本与所述标准译文之间的差异最小化。6.一种翻译模型的训练装置，其特征在于，所述训练装置包括：获取模块，用于...

【专利技术属性】
技术研发人员：毕天驰，张传强，徐梓翔，熊皓，何中军，李芝，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人