The invention discloses a sentence level machine translation quality estimation model training method based on mixed granularity, the training method includes the following steps: Step 1: mark the word level translation quality of machine translation; step 2: extract the translation quality features of source text and machine translation based on the depth learning method; step 3: carry out sentence level translation quality of mixed granularity In the training of the model, the error is calculated by training target, and then the parameters of the model are updated by gradient back propagation. The invention proposes a sentence level machine translation quality estimation model training method based on mixed granularity. The advantages of the method over the traditional method are: after the model training based on mixed granularity, compared with the training under a single granularity, the introduction of translation quality information at the word level can achieve better improvement.
【技术实现步骤摘要】
一种基于混合粒度的句子级机器翻译质量估计模型训练方法
本专利技术属于机器翻译质量估计领域,提出了一种基于混合粒度的句子级机器翻译质量估计模型训练方法。
技术介绍
在机器翻译研究领域,质量估计(QualityEstimation,简称QE)是指在不依赖于参考译文的情况下对机器翻译系统的输出进行质量预测,其结果可以快速的判断出机器翻译质量的好坏。这一功能对于机器翻译的研究人员和最终用户来说,都具有显而易见的应用价值,引起广泛关注。在机器翻译质量估计任务中,存在不同语言粒度的质量估计任务,即需要在不同的语言粒度(如句子级、词级)下给出译文的质量。随着深度学习的出现,通过对数据的分布式表示,缓解了传统机器学习方法数据稀疏的问题。因此,在机器翻译质量估计研究中,基于深度学习的机器翻译质量估计模型也成为了主流的研究方法。KimH等人提出了一种基于循环神经网络的预测器-评估器的深度模型,KaiF等人提出基于双向Transformer作为特征抽取模型,且将抽取的质量向量通过双向循环神经网络进行质量预测。这些基于深度学习的方法与传统方法相比均取得了更好的效果。对于已有的基于深度学习的翻译质量估计模型的训练而言,其在各个语言粒度任务上的训练大都是相互独立的。但实际上,在各个粒度上的译文质量估计任务间存在明显的关联。例如,译文中的每个词的翻译质量都影响着句子整体的翻译质量,若机器译文中存在大量翻译错误的词,则译文的句子级得分将较差。相反的,若机器译文大部分词的质量标签是正面的,则该译文句子级得分将较好。在机 ...
【技术保护点】
1.一种基于混合粒度的句子级机器翻译质量估计模型训练方法,其特征在于,所述训练方法包括以下步骤:/n步骤一:对机器译文进行词语级翻译质量标注;/n步骤二:对源文和机器译文进行基于深度学习方法的翻译质量特征抽取;/n步骤三:进行混合粒度的句子级翻译质量估计模型的训练,基于混合粒度的句子级机器翻译质量估计的训练目标为:/nJ
【技术特征摘要】
1.一种基于混合粒度的句子级机器翻译质量估计模型训练方法,其特征在于,所述训练方法包括以下步骤:
步骤一:对机器译文进行词语级翻译质量标注;
步骤二:对源文和机器译文进行基于深度学习方法的翻译质量特征抽取;
步骤三:进行混合粒度的句子级翻译质量估计模型的训练,基于混合粒度的句子级机器翻译质量估计的训练目标为:
Jmulti=λ*Jsent+(1-λ)*Jword
其中,Jmulti为整体误差,Jsent为句子级误差;Jword为词语级误差;λ作为引入额外语言粒度信息的权重因子,是模型训练过程中的一个超参数,表示引入额外语言粒度信息所占的比重,
通过上述训练目标计算误差,再通过梯度反向传播更新模型的参数。
2.根据权利要求1所述的一种基于混合粒度的句子级机器翻译质量估计模型训练方法,其特征在于,步骤一包括以下步骤:
步骤一一:引入句子级翻译质量估计任务的标注数据(S,M,H,T),其中,S为源文,M为译文,H为句子级分数...
【专利技术属性】
技术研发人员:杨沐昀,吴焕钦,赵铁军,王佳麒,朱聪慧,曹海龙,徐冰,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:黑龙;23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。