多语言翻译模型的生成方法、翻译方法及设备技术

技术编号：23485105 阅读：20 留言：0更新日期：2020-03-10 12:40

本发明专利技术公开了一种多语言翻译模型的生成方法、翻译方法及设备，多语言翻译模型的生成方法包括：构建语料库，所述语料库包括多个双语句对，所述双语句对包括互译的两个语句；将所述双语句对作为训练样本，对预设的多语言翻译网络进行训练，以生成多语言翻译模型，其中，所述多语言翻译模型适于将给定的源语言语句转换为中间语义表示，并根据所述中间语义表示将所述源语言语句翻译为目标语言语句。利用本发明专利技术实施例可生成多语言翻译模型，执行多语言语句的翻译任务。

The generation method, translation method and equipment of multilingual translation model

全部详细技术资料下载

【技术实现步骤摘要】
多语言翻译模型的生成方法、翻译方法及设备
本专利技术涉及计算机领域，尤其是涉及一种多语言翻译方法、翻译方法及其装置、设备和计算机可读存储介质。
技术介绍
机器翻译是指利用计算机程序将文字从一种自然语言(源语言)翻译成另一种自然语言(目标语言)的技术。目前，基于语料库的机器翻译技术代表着该领域的主流技术趋势，诸如统计机器翻译(StatisticalMachineTranslation，SMT)及神经网络机器翻译(NeuralMachineTranslation，NMT)，均依赖于含有大量训练数据的语料库来进行对翻译模型的训练。双语语料是这类语料库中的一种语料数据，无论对于SMT，还是NMT，绝大多数机器翻译技术均是基于双语语料进行模型训练。然而，由于双语语料仅是特定语言对(例如中-英、英-俄)的互译语料，因此训练得到的机器翻译模型也仅针对该特定语言对的翻译任务，对于第三种语言则无法做出应有的翻译。另一方面，一直以来，机器翻译领域中翻译模型所需的训练语料属于稀缺资源。举例来讲，目前认为，高质量的双语互译语料中，中-英双语互译句对有2亿条，英-俄双语互译句对有1亿条，而中-俄的双语互译句对仅有200万条。也就是说，与中-英、英-俄的双语语料库数据量相比，中-俄双语语料库的数据量明显偏少，属于稀缺资源语言对，以至于针对中-俄双语的机器翻译模型的训练无法达到预期，翻译质量堪忧。对于如何实现稀缺资源语言对的源语言与目标语言(例如中-俄)之间的翻译，目前已知的处理方式有两种：第一种方式是寻找一种桥接语言(例如英文)...

【技术保护点】
1.一种多语言翻译模型的生成方法，包括：/n构建语料库，所述语料库包括多个双语句对，所述双语句对包括互译的两个语句；/n将所述双语句对作为训练样本，对预设的多语言翻译网络进行训练，以生成多语言翻译模型，其中，所述多语言翻译模型适于将给定的源语言语句转换为中间语义表示，并根据所述中间语义表示将所述源语言语句翻译为目标语言语句。/n

【技术特征摘要】
1.一种多语言翻译模型的生成方法，包括：
构建语料库，所述语料库包括多个双语句对，所述双语句对包括互译的两个语句；
将所述双语句对作为训练样本，对预设的多语言翻译网络进行训练，以生成多语言翻译模型，其中，所述多语言翻译模型适于将给定的源语言语句转换为中间语义表示，并根据所述中间语义表示将所述源语言语句翻译为目标语言语句。

2.根据权利要求1所述的方法，其中，所述语料库中包括至少三种语言的语句。

3.根据权利要求1或2所述的方法，其中，所述双语句对包括采用第一语言编写的第一语句和采用第二语言编写的第二语句，所述多语言翻译网络包括依次相连的源端处理模块和目标端处理模块，
所述源端处理模块用于确定所述第一语句对应的第一中间语义表示；
所述目标端处理模块用于根据所述第一中间语义表示来生成所述第一语句所对应的第二语言的翻译语句。

4.根据权利要求3所述的方法，其中，所述对预设的多语言翻译网络进行训练，以生成多语言翻译模型的步骤包括：
根据所述翻译语句和所述第二语句来调整所述多语言翻译网络的参数；以及
将最优参数下的多语言翻译网络作为多语言翻译模型。

5.根据权利要求3所述的方法，其中，所述源端处理模块包括依次相连的编码器和源端注意力单元，
所述编码器用于确定所述第一语句所对应的隐状态表示；
所述源端注意力单元用于根据所述隐状态表示来生成所述第一语句的第一中间语义表示。

6.根据权利要求5所述的方法，其中，所述多语言翻译网络还包括语种向量单元，所述语种向量单元中存储有各个语言所对应的语种向量；
所述语种向量单元的输出端与所述源端注意力单元的输入端相连，所述源端注意力模块进一步用于根据所述隐状态表示和所述第一语言的语种向量来生成所述第一语句的第一中间语义表示。

7.根据权利要求5或6所述的方法，其中，所述源端处理模块还包括词嵌入单元，所述词嵌入单元的输出端与所述编码器的输入端相连，所述词嵌入单元用于生成所述第一语句所包括的词的词向量序列。

8.根据权利要求7所述的方法，其中，所述源端处理模块包括多个词嵌入单元，每个词嵌入单元对应于一种语言。

9.根据权利要求3所述的方法，其中，所述目标端处理模块包括依次相连的目标端注意力单元和解码器，
所述目标端注意力单元用于根据所述第一中间语义表示生成所述第一语句所对应的第二语言的隐状态表示；
所述解码器用于根据所述第二语言的隐状态表示确定所述第一语句所对应的第二语言的翻译结果。

10.根据权利要求9所述的方法，其中，所述多语言翻译网络还包括语种向量单元，所述语种向量单元中存储有各个语言所对应的语种向量；
所述语种向量单元的输出端与所述解码器的输入端相连，所述语种向量单元用于确定所述第二语言的隐状态表示的语种向量。

11.根据权利要求3所述的方法，其中，所述多语言翻译网络还包括对抗网络处理单元，用于采用生成式对抗网络对不同语言语句所对应的中间语义表示进行区分。

12.一种多语言翻译模型的生成装置，包括：
语料库构建模块，用于构建语料库，所述语料库包括多个双语句...

【专利技术属性】
技术研发人员：朱长峰，于恒，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人