利用外部信息的神经机器翻译方法技术

技术编号：19341938 阅读：35 留言：0更新日期：2018-11-07 13:49

本公开涉及利用外部信息的神经机器翻译方法，包括：接收源端源语言的文字序列作为源端输入；接收目标语言的文字序列作为外部信息输入；根据源端输入和外部信息输入，生成源端源语言文字序列的译文作为目标端输出。本公开提供的神经机器翻译方法通过在翻译过程中输入外部信息，为翻译提供了参考，有效提高了神经机器翻译的翻译效率。

Neural Machine Translation method using external information

The present disclosure relates to a neuro-machine translation method utilizing external information, including: receiving the text sequence of source language as source input; receiving the text sequence of target language as external information input; and generating the translation of source language text sequence as target output according to source input and external information input. The neuro-machine translation method provided in the present disclosure provides a reference for translation by inputting external information in the process of translation and effectively improves the translation efficiency of neuro-machine translation.

全部详细技术资料下载

【技术实现步骤摘要】
利用外部信息的神经机器翻译方法
本公开涉及自然语言处理的机器翻译
，尤其涉及一种利用外部信息的神经机器翻译方法。
技术介绍
近年来，随着计算机技术的迅猛发展，计算机硬件的算力不断提高，海量的数据得到广泛应用，机器学习方法特别是基于神经网络的深度学习方法取得了很大的发展和广泛的应用，这其中就包括基于神经网络的机器翻译方法，即神经机器翻译(NMT)。在NMT领域中，比较典型的是基于带有注意力机制的编码器解码器架构(Attention-basedEncoder-DecoderArchitecture)的神经机器翻译模型。其工作过程如下：输入待翻译的源端句子的词向量序列x，即x＝{x1,…,xi,…,xI}。随之使用一个基于神经网络的编码器将其编码为I个隐层表示h＝{h1,…,hi,…,hI}，接着使用一个基于神经网络的解码器进行解码。在每个解码时刻t，解码器首先读取1到t-1时刻生成的历史信息，然后通过注意力机制从源端的编码器的隐层表示h中获得当前时刻对应的源端上下文信息，从而生成目标端的隐层表示s＝{s1,…,st,…,sT}。进而通过T个目标端的隐层表示生成目标语言句子y＝{y1,…,yt,…,yT}。现有技术对NMT的研究主要集中于通过设计更复杂的模型来增强翻译系统的性能，然而，随着NMT的发展，通过设计更好的模型，使之能更好地从给定的有限规模的训练样本中学习翻译能力已经逐渐达到了一个瓶颈，与此同时还伴随着模型复杂性的上升和模型规模的增大。因此，如何在不过度增加模型复杂性的基础上提出一种提高翻译质量的方法，是本领域亟待解决的问题。
技术实现思路
有鉴于此...

【技术保护点】
1.一种利用外部信息的神经机器翻译方法，所述方法包括：接收源端源语言的文字序列作为源端输入；接收目标语言的文字序列作为外部信息输入；根据所述源端输入和所述外部信息输入，生成源端源语言文字序列的译文作为目标端输出。

【技术特征摘要】
1.一种利用外部信息的神经机器翻译方法，所述方法包括：接收源端源语言的文字序列作为源端输入；接收目标语言的文字序列作为外部信息输入；根据所述源端输入和所述外部信息输入，生成源端源语言文字序列的译文作为目标端输出。2.根据权利要求1所述的方法，其特征在于，所述根据所述源端输入和所述外部信息输入，生成源端源语言文字序列的译文作为目标端输出，包括：对所述源端输入的所述源端源语言的文字序列编码，得到源端源语言的神经网络隐层表示；在翻译的当前时刻t，根据所述源端源语言的神经网络隐层表示，得到目标端的隐层表示；根据所述目标端的隐层表示，得到所述当前时刻t的翻译预测原概率分布；对所述外部信息输入的目标语言的文字序列编码，得到外部信息的隐层表示；根据所述外部信息的隐层表示，得到所述当前时刻t的外部信息翻译概率分布；根据所述翻译预测原概率分布和所述外部信息翻译概率分布，得到所述当前时刻t的结合外部信息的翻译预测概率分布；根据每一时刻的所述结合外部信息的翻译预测概率分布，生成源端源语言文字序列的译文作为目标端输出。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：识别所述外部信息输入中的噪音，得到第一外部信息判别结果和/或第二外部信息判别结果；所述根据所述翻译预测原概率分布和所述外部信息翻译概率分布，得到所述当前时刻t的结合外部信息的翻译预测概率分布，包括：根据所述翻译预测原概率分布、所述外部信息翻译概率分布、所述第一外部信息判别结果和/或所述第二外部信息判别结果，得到所述当前时刻t的结合外部信息的翻译预测概率分布。4.根据权利要求3所述的方法，其特征在于，所述识别所述外部信息中的噪音...

【专利技术属性】
技术研发人员：黄书剑，郑在翔，戴新宇，张建兵，尹存燕，陈家骏，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人