多语言机器翻译模型训练方法、多语言翻译方法及装置制造方法及图纸

技术编号：32318795 阅读：32 留言：0更新日期：2022-02-16 18:24

本发明专利技术提供一种多语言机器翻译模型训练方法、多语言翻译方法及装置。训练方法包括：获取多语言翻译训练语料和多语言翻译验证语料；建立并初始化全参数共享的多语言翻译模型，利用多语言翻译训练语料和多语言翻译验证语料对多语言翻译模型进行训练，得到多语言机器翻译模型。在训练过程中模型自动判断每个共享的参数是否需要转变为语言相关的参数，复制需要转变的参数并将其分配给相关的语言，从而使得模型同时具有共享参数和语言相关参数。本发明专利技术用于在多语言机器翻译模型训练的过程中，自动判断参数是否需要共享以及需要被哪些语言对共享，而不依赖预先指定的共享或语言相关的模型组件。型组件。型组件。

全部详细技术资料下载

【技术实现步骤摘要】
多语言机器翻译模型训练方法、多语言翻译方法及装置

[0001]本专利技术涉及自然语言处理
，尤其涉及一种多语言机器翻译模型训练方法、多语言翻译方法及装置。

技术介绍

[0002]机器翻译是利用计算机将一种自然语言自动翻译成另一种自然语言的一门学科和技术，其中，自然语言翻译前通常称为源语言，翻译后通常称为目标语言。近些年来，随着深度学习技术的发展，基于神经网络的机器翻译方法在翻译质量上有了明显的提升，并得到了广泛的应用。相比于传统的基于统计的机器翻译方法，神经网络机器翻译模型能通过端到端的方式直接建模一个语言到另一个语言的映射。在这种模式下，通过扩展源端/目标端的语言数据，可以直接进行一个语言集合到另一个语言集合之间的映射，使得单个模型可以处理多个语言对之间的翻译，同时提高了训练和部署的效率，因此这种多语言翻译模型得到了广泛关注和应用。
[0003]在多语言翻译中，一个模型需要建模多个语言之间的映射关系，而不同语言之间存在语法差异，因此引入了语言冲突和模型瓶颈的问题，即在一个语言上进行优化会影响另一个语言的翻译质量，使得多语言翻译模型的效果不如双语翻译模型。目前解决该问题的方法是在一个所有语言共享的模型中，添加一些人工设计的语言独有组件，以提高模型对特定语言的建模能力。但是这种方法强烈依赖先验知识，需要语言学特征和经验指导语言独有部分的设计，而且难以扩展到其他语言上。

技术实现思路

[0004]本专利技术提供一种多语言机器翻译模型训练方法、多语言翻译方法 ...

【技术保护点】

【技术特征摘要】
1.一种多语言机器翻译模型训练方法，其特征在于，包括：获取多语言翻译训练语料和多语言翻译验证语料，所述多语言翻译训练语料为包含双语平行数据的多个语言对，所述多语言翻译验证语料包含为包含多语言平行数据的多个语言对；建立并初始化全参数共享的多语言翻译模型，利用所述多语言翻译训练语料和所述多语言翻译验证语料对所述多语言翻译模型进行训练，得到多语言机器翻译模型；其中，通过对多语言翻译模型的训练，将所述多语言翻译模型的全参数共享转化为部分参数共享且其余参数与语言相关，所述与语言相关的参数通过如下步骤确定：在训练过程中每次验证时，根据多语言翻译验证语料中所有语言对在每个参数上的梯度逐参数组对所述所有语言对进行二类别聚类；根据每个参数组二类别聚类后的类间距离选取参数组，复制选取的参数组得到参数组复制本；将所述选取的参数组和所述参数组复制本分别赋予选取的参数组的两个类别包含的语言对，获得与所述语言对包含的语言相关的参数。2.根据权利要求1所述多语言机器翻译模型训练方法，其特征在于，所述根据多语言翻译验证语料中所有语言对在每个参数上的梯度逐参数组对所述所有语言对进行二类别聚类具体包括如下步骤：获取多语言翻译验证语料中每个语言对在每个参数上的梯度，将所述多语言翻译模型的所有参数分为多个参数组，将所述每个参数组中所有语言对的梯度展开为梯度向量；计算所述每个参数组中所有语言对的梯度向量的余弦相似性，根据所述所有语言对的梯度向量的余弦相似性对每个参数组的语言对进行二类别聚类。3.根据权利要求1所述多语言机器翻译模型训练方法，其特征在于，所述根据每个参数组二类别聚类后的类间距离选取参数组具体包括如下步骤：获取每个参数组二类别聚类后的类间距离并排序，选取类间距离最大的K个参数组，其中K为正整数。4.根据权利要求1所述多语言机器翻译模型训练方法，其特征在于，所述每个语言对包括源语言句子和目标语言句子，所述包含双语平行数据的语言对的源语言和目标语言均为一种，所述包含多语言平行数据的语言对的源语言和目标语言均为一种或多种。5.一种多语言翻译方法，其特征在于，包括：获取待翻译源语言句子；根据权利要求1
‑
4任一项所述多语...

【专利技术属性】
技术研发人员：张家俊，王迁，宗成庆，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人