基于语法规约指导的神经机器翻译方法技术

技术编号：19745180 阅读：91 留言：0更新日期：2018-12-12 04:43

本发明专利技术涉及一种基于语法规约指导的神经机器翻译方法，为了得到更加精准的神经翻译模型而设计。本发明专利技术基于语法规约指导的神经机器翻译方法，本发明专利技术对源端和目标端都进行指导：在源端，添加了注意力损失来指导注意力集中在源端短语上；在目标端通过一层子网络来指导目标端词关注到合适的目标端短语上。网络的源端和目标端构成一个汇总损失，称为指导损失，用于指导NMT。本发明专利技术能够有效地改善神经机器翻译质量。

全部详细技术资料下载

【技术实现步骤摘要】
基于语法规约指导的神经机器翻译方法
本专利技术具体涉及一种基于语法规约指导的神经机器翻译方法。
技术介绍
机器翻译是指借助计算机自动地将一种语言转化成另一种语言的技术。随着深度学习的发展和计算能力的增强，神经网络技术也被运用到机器翻译领域当中，神经机器翻译(NeuralMachineTranslation，简称NMT)受到了人们广泛的关注。随着注意力机制(AttentionMechanism)加入到神经机器翻译中，神经机器翻译逐渐兴起并且综合效果快速超过了统计机器翻译(StatisticMachineTranslation，简称SMT)，这也使得NMT在产学研中得到了普遍的应用。国内外科研人员以此为基础逐步完善机器翻译模型，谷歌，百度等公司也逐步从SMT过渡到NMT，提升翻译效果，增强用户粘性。机器翻译的目标是打破语言屏障，增进不同国家不同文化之间的信息交流。随着国内外文化交流，经济贸易的增加，普适性的翻译系统需求也更加紧缺，如何让翻译系统达到信、达、雅的要求也是国内外科研人员追求的目标。机器翻译的主要两种系统介绍如下：基准系统：端对端的神经机器翻译(NMT)已经成为机器翻译领域的新范式[Sutskeveretal.,2014；Bahdanauetal.,2015]。通过给定的源端句子X＝x1,x2,…x|X|,NMT直接对目标翻译Y的条件概率P(Y|X)建模。神经机器翻译通常由两部分组成：编码器和解码器，这两部分通常使用循环神经网络(RecurrentNeuralNetwork，简称RNN)来对序列建模，实际运用中通常使用的是门循环单元(GatedRec...

【技术保护点】
1.一种基于语法规约指导的神经机器翻译方法，其特征在于，包括：获取训练数据，基于语法规约计算源端训练数据的注意力层指导损失Δatt，目标端训练数据的生成层指导损失Δatt；对计算得到的源端训练数据的注意力层指导损失Δatt与目标端训练数据的生成层指导损失Δatt的和与句对(X，Y)的交叉熵损失分配不同的权重比例，定义网络整体损失具体计算公式为：loss＝‑(1‑λ)*logP(Y|X)+λ*(Δatt+Δtgt)其中，‑logP(Y|X)是交叉熵损失，λ是权重，用来分配交叉熵损失与两个指导损失之和的分配比例。

【技术特征摘要】
1.一种基于语法规约指导的神经机器翻译方法，其特征在于，包括：获取训练数据，基于语法规约计算源端训练数据的注意力层指导损失Δatt，目标端训练数据的生成层指导损失Δatt；对计算得到的源端训练数据的注意力层指导损失Δatt与目标端训练数据的生成层指导损失Δatt的和与句对(X，Y)的交叉熵损失分配不同的权重比例，定义网络整体损失具体计算公式为：loss＝-(1-λ)*logP(Y|X)+λ*(Δatt+Δtgt)其中，-logP(Y|X)是交叉熵损失，λ是权重，用来分配交叉熵损失与两个指导损失之和的分配比例。2.根据权利要求1所述的基于语法规约指导的神经机器翻译方法，其特征在于，源端训练数据的注意力层指导损失Δatt的具体计算公式为：其中，αji计算了目标端j时刻单词对应源端i时刻单词注意力权重对应的注意力权重，lj为目标端词yj对应的源端短语最...

【专利技术属性】
技术研发人员：段湘煜，王坤，谭敏，骆卫华，张民，
申请(专利权)人：苏州大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人