【技术实现步骤摘要】
一种神经网络机器翻译方法及装置
[0001]本专利技术涉及一种神经网络机器翻译方法及装置。
技术介绍
[0002]随着神经网络(Neural Machine)兴起,人们不断尝试将神经网络应用在自然语言处理(Natural Language Processing,NLP)中,比如,使用神经网络机器翻译(Neural Machine Translation)将源语言转换为目标语言。其中,转换器模型(Transformer Model)是现在神经网络机器翻译的基准模型。利用基于自关注神经网络的Transformer模型对源语句进行编解码处理得到目标语句,翻译得到的目标语句意思表达准确、易于理解。但是,现有技术中的利用Transformer模型的翻译方法中,在进行语言处理时,一般是每个源语句单独处理,会造成翻译结果准确度低的问题。
技术实现思路
[0003]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的神经网络机器翻译方法及装置。
[0004]第一方面,本专利技术实施例提供一种神经网络机器翻译方法,包括如下步骤:
[0005]对获取的多个源端序列进行编码处理,得到当前词的全局编码结果,对所述多个源端序列中当前词所在当前序列进行编码处理,得到当前词的局部编码结果;
[0006]根据已翻译完成的目标语句对应的目标端序列、所述当前词的局部编码结果和全局编码结果进行解码,得到当前词的局部解码中间状态和全局解码中间状态;
[0007]对所述局部解码中间 ...
【技术保护点】
【技术特征摘要】
1.一种神经网络机器翻译方法,包括:对获取的多个源端序列进行编码处理,得到当前词的全局编码结果,对所述多个源端序列中当前词所在当前序列进行编码处理,得到当前词的局部编码结果;根据已翻译完成的目标语句对应的目标端序列、所述当前词的局部编码结果和全局编码结果进行解码,得到当前词的局部解码中间状态和全局解码中间状态;对所述局部解码中间状态和所述全局解码中间状态进行融合处理,得到当前词的解码结果。2.根据权利要求1所述的方法,所述对获取的多个源端序列进行编码处理,得到当前词的全局编码结果,对所述多个源端序列中当前词所在当前序列进行编码处理,得到当前词的局部编码结果,包括:根据多个源端序列中的当前词所在当前序列中的前后文信息,得到所述当前词的局部编码结果;根据所述当前词在所述多个源端序列中的前后文信息以及所述多个源端序列中各个词的局部编码结果,得到所述当前词的全局编码结果。3.根据权利要求2所述的方法,所述根据已翻译完成的目标语句对应的目标端序列、所述当前词的局部编码结果和全局编码结果进行解码,得到当前词的局部解码中间状态和全局解码中间状态,包括:根据所述已翻译完成的目标语句对应的目标端序列中所述当前序列对应的目标端序列和所述当前序列中各个词的局部编码结果,得到所述当前词的局部解码中间状态;根据所述已翻译完成的目标语句对应的目标端序列和所述多个源端序列中各个词的全局编码结果,得到所述当前词的全局解码中间状态。4.根据权利要求2或3所述的方法,所述根据多个源端序列中的当前词所在当前序列中的前后文信息,得到所述当前词的局部编码结果,包括:根据预设的第一参数特征和所述当前序列中的前后文信息,得到第一查询特征、第一值特征和第一键特征;根据所述第一查询特征、所述第一值特征和所述第一键特征对所述当前词进行自注意编码处理,得到所述当前词的局部编码结果。5.根据权利要求4所述的方法,所述根据所述当前词在所述多个源端序列中的前后文信息以及所述多个源端序列中各个词的局部编码结果,得到所述当前词的全局编码结果,包括:根据预设的第二参数特征和所述多个源端序列中各个词的局部编码结果,得到第二查询特征、第二值特征和第二键特征;根据所述第二查询特征、所述第二值特征和所述第二键特征对所述当前词进行自注意编码处理,得到所述当前词的全局编码结果。6.根据权利要求5所述的方法,所述根据所述已翻译完成的目标语句对应的目标端序列中所述当前序列对应的目标端序列和所述当前序列中各个词的局部编码结果,得到所述当前词的局部解码中间状态,包括:确定所述当前序列对应的目标端序列中所述当前词对应的目标词,根据所述目标词在所述当前序列对应的目标端序列中的前文信息,对所述当前词对应的目标词进行自注意编
码处理得到局部目标编码结果;根据所述当前序列中各个词的局部编码结果及所述局部目标编码结果,对所述当前词进行自注意解码处理得到所述当前词的局部解码中间状态。7.根据权利要求6所述的方法,所述确定所述当前序列对应的目标端序列中所述当前词对应的目标词,根据所述目标词在所述当前序列对应的目标端序列中的前文信息,对所述当前词对应的目标词进行自注意编码处理得到局部目标编码结果,包括:确定所述当前序列对应的目标端序列,在所述当前序列对应的目标端序列中查找并确定所述当前词对应的目标词;根据预设的第三参数特征和所述当前词对应的目标词在所述当前序列对应的目标端序列中的前文信息,得到第三查询特征、第三值特征和第三键特征;根据所述第三查询特征、所述第三值特征和所述第三键特征对所述当前词对应的目标词进行自注意编码处理,得到所述局部目标编码结果。8.根据权利要求7所述的方法,所述根据所述当前序列中各个词的局部编码结果及所述局部目标编码结果对所述当前词进行自注意解码处理得到所述当前词的局部解码中间状态,包括:根据预设的第四参数特征、所述局部目标编码结果和所述当前序列中各个词的局部编码结果,得到第四查询特征、第四值特征和第四键特征;根据所述第四查询特征、所述第四值特征和所述第四键特征对所述当前词进行自注意解码处理,得到所述当前词的局部解码中间状态。9.根据权利要求5所述的方法,根据所述已翻译完成的目标语句对应的目标端序列和所述多个源端序列中各个词的全局编码结果,得到所述当前词的全局解码中间状态,包括:确定所述已翻译...
【专利技术属性】
技术研发人员:张珮,樊楷,葛妮瑜,陈博兴,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。