神经机器翻译模型的训练方法、装置及存储介质制造方法及图纸

技术编号:25522662 阅读:43 留言:0更新日期:2020-09-04 17:12
本发明专利技术提供了一种神经机器翻译模型的训练方法、装置及存储介质。本发明专利技术实施例提供的神经机器翻译模型的训练方法、装置及存储介质,利用训练好的神经机器翻译模型获得源句子翻译后的预测句子,基于预测句子与目标句子之间N元组的匹配程度,合成新的平行语料,利用原始语料和新增语料训练神经机器翻译模型,以增强原始神经机器翻译模型未能训练充分部分的特征,从而可以提升最终训练得到的神经机器翻译模型的翻译性能。

【技术实现步骤摘要】
神经机器翻译模型的训练方法、装置及存储介质
本专利技术涉及自然语言处理(NLP,NaturalLanguageProcessing)中的神经机器翻译
,具体涉及一种神经机器翻译模型的训练方法、装置及存储介质。
技术介绍
神经机器翻译(NMT,NeuralMachineTranslation)是指直接采用神经网络以端到端方式进行翻译建模的机器翻译方法。区别于利用深度学习技术完善传统统计机器翻译中某个模块的方法,神经机器翻译采用一种简单直观的方法完成翻译工作:首先使用一个称为编码器(Encoder)的神经网络将源语言句子编码为一个稠密向量,然后使用一个称为解码器(Decoder)的神经网络从该向量中解码出目标语言句子。上述神经网络模型一般称之为“编码器-解码器”(Encoder-Decoder)结构。现有技术通常采用双语互译质量评估(BLEU,BilingualEvaluationUnderstudy)算法来评估机器翻译质量。BLEU算法的设计思想与评判机器翻译好坏的思想是一致的,即,机器翻译结果越接近专业人工翻译的结果,则翻本文档来自技高网...

【技术保护点】
1.一种神经机器翻译模型的训练方法,其特征在于,包括:/n利用第一平行语料,训练神经机器翻译模型;/n通过训练得到的所述神经机器翻译模型,翻译第二平行语料中的源句子,得到与所述源句子对应的预测句子;/n计算所述预测句子与所述源句子对应的目标句子的匹配度,在所述匹配度低于预设门限时,将所述源句子及所述目标句子添加至一新增平行语料;/n利用所述第一平行语料和所述新增平行语料,训练神经机器翻译模型。/n

【技术特征摘要】
1.一种神经机器翻译模型的训练方法,其特征在于,包括:
利用第一平行语料,训练神经机器翻译模型;
通过训练得到的所述神经机器翻译模型,翻译第二平行语料中的源句子,得到与所述源句子对应的预测句子;
计算所述预测句子与所述源句子对应的目标句子的匹配度,在所述匹配度低于预设门限时,将所述源句子及所述目标句子添加至一新增平行语料;
利用所述第一平行语料和所述新增平行语料,训练神经机器翻译模型。


2.如权利要求1所述的方法,其特征在于,
所述第一平行语料与所述第二平行语料之间不存在相同语料;
或者,
所述第二平行语料为所述第一平行语料中的部分或全部语料。


3.如权利要求1所述的方法,其特征在于,所述计算所述预测句子与所述源句子对应的目标句子的匹配度,在所述匹配度低于预设门限时,将所述源句子及所述目标句子添加至一新增平行语料的步骤,包括:
计算所述预测句子与所述目标句子之间相匹配的N元组的第一数量,所述N大于或等于2;
在所述第一数量小于所述预设门限时,将所述源句子及所述目标句子添加至所述新增平行语料。


4.如权利要求3所述的方法,其特征在于,
所述预设门限是根据所述N元组的N的取值,所述预测句子包括的单词的第二数量,以及,所述目标句子包括的单词的第三数量设置的。


5.如权利要求3所述的方法,其特征在于,在计算所述预测句子与所述目标句子之间相匹配的N元组的第一数量的步骤之前,所述方法还包括:将所述预测句子,转换成与所述目标句子相同的格式。


6.如权利要求3所述的方法,其特征在于,在将所述源句子及所述目标句子添加至一新增平行语料的步骤之前,所述方法还包括:
将所述目标句子,转换成与所述源句子相同的格式。


7.一种神经机器翻译模型的训练装置,其特征在于,包括:
第一训练单元,用...

【专利技术属性】
技术研发人员:刘柏延李一韩姜珊珊童毅轩董滨
申请(专利权)人:株式会社理光
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1