当前位置: 首页 > 专利查询>波音公司专利>正文

神经机器翻译方法以及神经机器翻译装置制造方法及图纸

技术编号:24854836 阅读:49 留言:0更新日期:2020-07-10 19:08
本申请公开了神经机器翻译方法以及神经机器翻译装置。该神经机器翻译方法,包括:获取待翻译的源语句以及作为源语句的候选译文的目标语句,以形成原始训练语料,计算源语句中包含的每个单词的翻译熵;判断每个单词的翻译熵是否大于预定阈值;根据判断结果,将翻译熵大于预定阈值的单词确定为易漏翻的单词;将易漏翻的单词的候选译文替换为预先设定的字符,以形成新目标语句;根据源语句与新目标语句形成新训练语料;基于原始训练语料和新训练语料来对神经机器翻译模型进行参数训练,以及利用经参数训练的神经机器翻译模型执行机器翻译。

【技术实现步骤摘要】
神经机器翻译方法以及神经机器翻译装置
本专利技术涉及自然语言处理
,更具体地,涉及能够降低漏翻率的神经机器翻译方法以及装置。
技术介绍
近年来,利用深度学习模型所构建的神经机器翻译(NMT,NeuralMachineTranslation)越来越受到人们的关注。神经机器翻译是指直接采用神经以端到端(End-to-End)方式进行翻译建模的机器翻译方法,其基本思想是使用神经直接将源语言映射成目标语言文本。英国牛津大学的NalKalchbrenner和PhilBlunsom于2013年首先提出了端到端的神经翻译模型。他们为机器翻译提出了一个“编码器-解码器”的新框架:给定一个源语言句子,首先使用一个编码器将其映射为一个连续、稠密的向量,然后再使用一个解码器将该向量转化为一个目标语言句子。随着深度学习技术的发展,神经机器翻译模型被广泛研究,并展现出了相较于统计机器翻译模型的巨大优势。神经机器翻译在翻译性能上的不断提升,也促进了工业界机器翻译的发展。Junczys-Dowmunt等人在联合国平行语料库(UnitedNationsParal本文档来自技高网...

【技术保护点】
1.一种神经机器翻译方法,其特征在于,包括:/n获取待翻译的源语句以及作为所述源语句的候选译文的目标语句,以形成原始训练语料,/n计算所述源语句中包含的每个单词的翻译熵;/n判断每个单词的所述翻译熵是否大于预定阈值;/n根据判断结果,将翻译熵大于所述预定阈值的单词确定为易漏翻的单词;/n将所述易漏翻的单词的候选译文替换为预先设定的字符,以形成新目标语句;/n根据所述源语句与所述新目标语句形成新训练语料;/n基于所述原始训练语料和所述新训练语料来对神经机器翻译模型进行参数训练,以及/n利用经参数训练的神经机器翻译模型执行机器翻译。/n

【技术特征摘要】
1.一种神经机器翻译方法,其特征在于,包括:
获取待翻译的源语句以及作为所述源语句的候选译文的目标语句,以形成原始训练语料,
计算所述源语句中包含的每个单词的翻译熵;
判断每个单词的所述翻译熵是否大于预定阈值;
根据判断结果,将翻译熵大于所述预定阈值的单词确定为易漏翻的单词;
将所述易漏翻的单词的候选译文替换为预先设定的字符,以形成新目标语句;
根据所述源语句与所述新目标语句形成新训练语料;
基于所述原始训练语料和所述新训练语料来对神经机器翻译模型进行参数训练,以及
利用经参数训练的神经机器翻译模型执行机器翻译。


2.根据权利要求1所述的神经机器翻译方法,其特征在于,计算所述源语句中包含的每个单词的翻译熵包括:
获取每个单词的多个候选译文和每个候选译文的翻译概率,所述翻译概率表示所述候选译文是对应的所述单词的目标译文的概率,
根据每个单词的候选译文的数量以及各个候选译文的翻译概率计算每个单词的翻译熵,其中,所述翻译熵的计算公式表达为如下:



其中,s指示单词,K表示单词s的候选译文的数量,pk表示每个候选译文的翻译概率,以及E(s)表示单词s的翻译熵。


3.根据权利要求1或2所述的神经机器翻译方法,其特征在于,基于所述原始训练语料和所述新训练语料来对神经机器翻译模型进行参数训练包括:
基于所述原始训练语料和所述新训练语料,采用极大似然目标函数,使用梯度下降法对所述神经机器翻译模型进行参数训练。


4.根据权利要求3所述的神经机器翻译方法,其特征在于,所述原始训练语料由表示,所述新训练语料由表示,所述极大似然目标函数为:其中,N代表源语句数量,n表示第n个语句,X{n}表示源语句,Y{n}表示目标语句,Z{n}表示新目标语句,λ为修正系数,p()表示通过所述神经机器翻译模型得到的翻译概率,θ表示所述神经机器翻译模型的参数,D表示所有语料并且D=Dxy∪Dxz。


5...

【专利技术属性】
技术研发人员:张家俊周玉赵阳宗成庆杨里
申请(专利权)人:波音公司中国科学院自动化研究所
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1