【技术实现步骤摘要】
一种翻译系统及其训练、应用方法以及相关设备
[0001]本申请涉及机器翻译领域,尤其涉及一种翻译系统及其训练、应用方法以及相关设备。
技术介绍
[0002]机器翻译是指将一种语言的语句翻译为具有相同含义的另一种语言的语句。机器翻译包括基于规则的机器翻译、基于统计的机器翻译和基于神经网络的机器翻译。基于神经网络的机器翻译今年来迅速崛起,相比于基于规则和基于统计的机器翻译,基于神经网络的机器翻译的模型构建更加简单,翻译也更加准确性。因此,如何提供一种基于神经网络的机器翻译系统是一个亟待解决的技术问题。
技术实现思路
[0003]本申请提供一种翻译系统及其训练、应用方法以及相关设备,能够提高翻译系统的训练效率,节约计算资源,并能够提高翻译系统的可扩展性。
[0004]第一方面,本申请提供一种翻译系统的训练方法,该翻译系统包括第一语言模型和第二语言模型,其中,第一语言模型包括第一编码器、第一对齐编码器、第一对齐解码器和第一解码器,第二语言模型包括第二编码器、第二对齐编码器、第二对齐解码器和第二解码器,该方法包括:
[0005]获取基于第一语言的语料训练得到的第一语言的第一编码器和第一解码器,获取基于第二语言的语料训练得到的第一语言的第二编码器和第二解码器;其中,第一编码器用于对第一语言表述的语句进行编码,输出对应的向量,第一解码器用于对输入的向量进行解码,输出第一语言表述的语句;第二编码器用于对第二语言表述的语句进行编码,输出对应的向量,第二解码器用于对输入的向量进行解码,输出第二语言表述的语 ...
【技术保护点】
【技术特征摘要】
1.一种翻译系统的训练方法,其特征在于,所述翻译系统包括第一语言模型和第二语言模型,所述第一语言模型包括第一编码器、第一对齐编码器、第一对齐解码器和第一解码器,所述第二语言模型包括第二编码器、第二对齐编码器、第二对齐解码器和第二解码器,所述方法包括:获取基于第一语言的语料训练得到的所述第一语言的第一编码器和所述第一解码器,获取基于第二语言的语料训练得到的所述第一语言的所述第二编码器和所述第二解码器;基于平行语料对所述第一语言模型和所述第二语言模型进行联合训练,得到训练好的第一对齐编码器、训练好的第一对齐解码器、训练好的第二对齐编码器和训练好的第二对齐解码器,所述平行语料包括所述第一语言和所述第二语言的同义语句的集合;其中,所述第一对齐编码器用于将所述第一编码器输出的向量转换到对齐向量空间,所述第二对齐编码器用于将所述第二编码器输出的向量转换到所述对齐向量空间;所述第一对齐解码器用于将所述第一对齐编码器的输出转换到所述第一解码器的输入对应的向量空间中,以使所述第一解码器对所述第一对齐解码器的输出进行解码,输出第一语言的语句;所述第二对齐解码器用于将所述第二对齐编码器的输出转换到所述第二解码器的输入的向量空间中,以使所述第二解码器对所述第二对齐解码器的输出进行解码,输出第二语言的语句。2.根据权利要求1所述的方法,其特征在于,所述基于平行语料对所述第一语言模型和所述第二语言模型进行联合训练,包括:通过第一对齐编码器对第一编码器输出的第一语句对应的向量进行编码,以及通过第二对齐编码器对第二编码器输出的第二语句对应的向量进行编码,所述第一语句和所述第二语句是使用两种语言表述的具有相同语义的语句;基于所述第一对齐编码器的输出和所述第二对齐编码器的输出,更新所述第一对齐编码器的参数和所述第二对齐编码器的参数;通过所述第一对齐解码器对所述第一对齐编码器的输出进行解码,基于所述第一对齐解码器的输出和所述第一编码器的输出,更新所述第一对齐解码器的参数和所述第一对齐编码器的参数;通过所述第二对齐解码器对所述第二对齐编码器的输出进行解码,基于所述第二对齐解码器的输出和所述第二编码器的输出,更新所述第二对齐解码器的参数和所述第二对齐编码器的参数。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一对齐编码器的输出和所述第二对齐编码器的输出,更新所述第一对齐编码器的参数和所述第二对齐编码器的参数,包括:基于所述对齐编码器的输出和所述第二对齐编码器的输出,计算语义对齐损失,根据所述语义对齐损失更新所述第一对齐编码器的参数和所述第二对齐编码器的参数。4.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述翻译系统还包括第三语言模型,所述第三语言模型包括第三编码器、第三对齐编码器、第三对齐解码器和第三解码器;所述方法还包括:获取基于第三语言的语料训练得到的所述第三语言的第三编码器和所述第三解码器;所述通过平行语料对所述第一语言模型和所述第二语言模型进行训练,得到训练好的
所述第一语言模型和所述第二语言模型,包括:通过平行语料对所述第一语言模型、所述第二语言模型和所述第三语言模型进行联合训练,得到训练好的所述第一语言模型、训练好的所述第二语言模型和训练好的所述第三语言模型,所述平行语料包括所述第一语言、所述第二语言和所述第三语言的同义语句的集合;其中,所述第三对齐编码器用于将所述第三编码器输出的向量转换到所述对齐向量空间;所述第三对齐解码器用于将所述第三对齐编码器的输出转换到所述第三解码器的输入对应的向量空间,以使所述第三解码器对所述第三对齐解码器的输出进行解码,输出第三语言的语句。5.根据权利要求4所述的方法,其特征在于,通过平行语料对所述第一语言模型、所述第二语言模型和所述第三语言模型进行联合训练,包括:通过第一对齐编码器对第一编码器输出的第一语句对应的向量进行编码、通过第二对齐编码器对第二编码器输出的第二语句对应的向量进行编码以及通过第三对齐编码器对第三编码器输出的第三语句进行编码,所述第一语句、所述第二语句和所述第三语句是使用三种语言表述的具有相同语义的语句;基于所述第一对齐编码器的输出、所述第二对齐编码器的输出和所述第三对齐编码器的输出,更新所述第三对齐编码器的参数;通过所述第三对齐解码器对所述第三对齐编码器的输出进行解码,基于所述第三对齐解码器的输出和所述第三编码器的输出,更新所述第三对齐解码器的参数和所述第三对齐编码器的参数。6.一种翻译方法,其特征在于,包括:通过第一编码器对输入的第一语言的第一源语句进行编码,输出所述第一源语句对应的向量集合,所述第一源语句对应的向量集合中的向量属于第一解码器的输入对应的向量空间;通过第一对齐编码器将所述第一源语句对应的向量集合中的向量转换为对齐向量空间中的第一特征向量集合;通过第二对齐解码器将所述第一特征向量集合中的向量转换为第二解码器的输入对应的向量空间的向量;通过第二解码器对所述第二对齐解码器输出的向量进行解码,输出所述第一源语句对应的所述第二语言的翻译语句。7.根据权利要求6所述的方法,其特征在于,还包括:通过第二编码器对输入的所述第二语言的第二源语句进行编码,输出所述第二源语句对应的向量集合,所述第二源语句对应的向量集合中的向量属于所述第二解码器的输入对应的向量空间;通过第二对齐编码器将所述第二解码器的输入对应的向量集合中的向量转换为所述对齐向量空...
【专利技术属性】
技术研发人员:史佳欣,常建龙,宁可,陈鑫,张恒亨,田奇,
申请(专利权)人:华为云计算技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。