当前位置: 首页 > 专利查询>苏州大学专利>正文

将句子权重融入神经机器翻译的领域适应方法技术

技术编号:18783628 阅读:46 留言:0更新日期:2018-08-29 06:54
本发明专利技术涉及一种将句子权重融入神经机器翻译的领域适应方法,应用在基于注意力机制且采用encoder‑decoder框架的NMT模型,包括:计算out‑of‑domain句子与in‑domain语料的相似度来赋予句子权重;将所述句子权重信息融入NMT训练。上述将句子权重融入神经机器翻译的领域适应方法,我们利用NMTencoder的自身信息用领域相似度的方法得到权重,并将权重融入NMT训练。这种新方法比论文“Instance weighting for neural machine translation domain adaptation”中的方法能取得更好的翻译效果。

【技术实现步骤摘要】
将句子权重融入神经机器翻译的领域适应方法
本专利技术涉及技术翻译领域,特别是涉及将句子权重融入神经机器翻译的领域适应方法。
技术介绍
随着计算机计算能力的提高以及大数据的应用,深度学习取得进一步的应用。基于深度学习的NeuralMachineTranslation越来越受到人们的关注。在NMT领域中,最常用的一种翻译模型是带有注意力机制(attention-based)的encoder-decoder模型。其主要思想是将待翻译的语句(在下文中统称为‘源语句’)经过编码器(encoder)编码成为一个向量表示,然后利用解码器(decoder)对源语句的向量表示进行解码,翻译成为其对应的译文(在下文中统称为‘目标语句’)。在很多机器学习任务中,模型在训练时所采用的样本和模型在测试时所采用的样本分布不一致,导致了领域适应性问题。在统计机器翻译中,领域适应已有着广泛的研究,但在NMT领域中,领域适应还是一个尚在研究的问题。一些统计机器翻译中运用的方法,如数据选择、多模型联合训练等方法,可以应用在NMT中,但也有方法如训练数据带权重等在NMT中不易被使用,因为NMT不是一个线性模型或其组合。现本文档来自技高网...

【技术保护点】
1.一种将句子权重融入神经机器翻译的领域适应方法,应用在基于注意力机制且采用encoder‑decoder框架的NMT模型,其特征在于,包括:计算out‑of‑domain句子与in‑domain领域的相似度来赋予所述句子权重;将所述句子权重信息融入NMT训练。

【技术特征摘要】
1.一种将句子权重融入神经机器翻译的领域适应方法,应用在基于注意力机制且采用encoder-decoder框架的NMT模型,其特征在于,包括:计算out-of-domain句子与in-domain领域的相似度来赋予所述句子权重;将所述句子权重信息融入NMT训练。2.根据权利要求1所述的将句子权重融入神经机器翻译的领域适应方法,其特征在于,在步骤“计算out-of-domain句子与in-domain领域的相似度来赋予句子权重;”中,利用JS散度的方法计算两者的相似度。3.根据权利要求1所述的将句子权重融入神经机器翻译的领域适应方法,其特征在于,在步骤“计算out-of-domain句子与in-domain领域的相似度来赋予句子权重;”中,利用欧式距离的方法计算两者的相似度。4.根据权利要...

【专利技术属性】
技术研发人员:熊德意张诗奇
申请(专利权)人:苏州大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1