一种机器翻译的方法、设备以及计算机可读存储介质技术

技术编号:24854844 阅读:45 留言:0更新日期:2020-07-10 19:08
本申请实施例公开了一种机器翻译的方法,该方法应用于人工智能领域。本申请实施例方法包括:接收待处理信息,所述待处理信息以源语言表示;采用编码器对所述待处理信息进行编码处理,生成所述待处理信息的表示向量序列;通过预测模型预测第一时刻待翻译的目标展望词的特征信息,所述目标展望词以目标语言表示;根据所述目标展望词的特征信息确定所述表示向量序列中当前时刻对应的上下文向量;采用解码器对所述上下文向量进行解码处理,得到所述上下文向量对应的以目标语言表示的目标内容。本申请实施例中还提供一种翻译设备,用于提高翻译的准确率。

【技术实现步骤摘要】
一种机器翻译的方法、设备以及计算机可读存储介质本申请为2018年2月8日提交中国专利局、申请号为201810131743.0、专利技术名称为“一种机器翻译的方法、设备以及计算机可读存储介质”的中国专利申请的分案申请。
本专利技术涉及计算机领域,尤其涉及一种机器翻译的方法、设备以及计算机可读存储介质。
技术介绍
机器翻译(machinetranslation,MT)是指使用机器将文本或言语从一种源语言转化为具有相同含义内容的另一种目标语言的过程。随着深度学习的兴起,最近两年深层神经网络技术在MT上也得到应用,神经网络机器翻译(neuralmachinetranslation,NMT)成为新一代翻译技术。目前,NMT使用编码器-解码器框架来实现理解语义再翻译的过程,其中,编码器用于对输入端进行编码,解码器对输出端进行解码,例如,给定一个输入的源语言句子,首先利用编码器将它编码成输入端的表示向量;然后,在解码阶段,它采用解码器根据源端的表示向量和当前时刻源端上下文向量每次生成一个新的目标词。尽管源语言句子已知,但目标语言的单词本文档来自技高网...

【技术保护点】
1.一种机器翻译的方法,其特征在于,包括:/n接收待处理信息,所述待处理信息以源语言表示;/n采用循环神经网络对所述待处理信息进行编码处理,生成所述待处理信息的表示向量序列;/n基于第二时刻的展望词,通过预测模型预测第一时刻待翻译的目标展望词的特征信息,所述目标展望词以目标语言表示,所述第二时刻为所述第一时刻之前的相邻时刻;/n根据所述目标展望词的特征信息,通过注意力模型获取所述表示向量序列中当前时刻对应的上下文向量;/n采用解码器对所述上下文向量进行解码处理,得到所述上下文向量对应的以目标语言表示的目标内容。/n

【技术特征摘要】
1.一种机器翻译的方法,其特征在于,包括:
接收待处理信息,所述待处理信息以源语言表示;
采用循环神经网络对所述待处理信息进行编码处理,生成所述待处理信息的表示向量序列;
基于第二时刻的展望词,通过预测模型预测第一时刻待翻译的目标展望词的特征信息,所述目标展望词以目标语言表示,所述第二时刻为所述第一时刻之前的相邻时刻;
根据所述目标展望词的特征信息,通过注意力模型获取所述表示向量序列中当前时刻对应的上下文向量;
采用解码器对所述上下文向量进行解码处理,得到所述上下文向量对应的以目标语言表示的目标内容。


2.根据权利要求1所述的方法,其特征在于,所述基于第二时刻的展望词,通过预测模型预测第一时刻待翻译的目标展望词的特征信息之前,所述方法还包括:
根据数据集合中的信息训练所述预测模型,所述数据集合包括源语言语句,与所述源语言语句对应的目标语言语句,及所述目标语言语句的特征信息。


3.根据权利要求1所述的方法,其特征在于,所述根据所述目标展望词的特征信息,通过注意力模型获取所述表示向量序列中当前时刻对应的上下文向量,包括:
获取所述目标展望词的特征信息;
对所述目标展望词的特征信息进行估计,得到估计结果;
根据所述估计结果,通过所述注意力模型确定所述表示向量序列中第一时刻对应的上下文向量。


4.根据权利要求1所述的方法,其特征在于,所述基于第二时刻的展望词,通过预测模型预测第一时刻待翻译的目标展望词的特征信息,包括:
采用所述预测模型根据所述解码器在所述第二时刻的隐含状态预测第一时刻待翻译的目标展望词的特征信息。


5.根据权利要求4所述的方法,其特征在于,所述采用所述预测模型根据所述解码器在所述第二时刻的隐含状态预测第一时刻待翻译的目标展望词的特征信息,包括:
采用如下方式计算所述第一时刻待翻译的目标展望词的特征信息:
βi=P(ui|y<i,x)=softmax(ψ(yi-1,Si-1));
其中,所述ψ表示前向反馈神经网络,所述i表示第一时刻,所述(i-1)表示第二时刻,所述softmax()表示归一化操作,所述Si-1表示所述第二时刻的隐含状态,所述yi表示所述第一时刻待翻译的目标展望词,所述yi-1表示在所述第二时刻目标端输出的对应序列,预测模型βi读入表示在所述第二时刻解码器的隐含状态Si-1。


6.根据权利要求1所述的方法,其特征在于,所述基于第二时刻的展望词,通过预测模型预测第一时刻待翻译的目标展望词的特征信息,包括:
采...

【专利技术属性】
技术研发人员:刘乐茂李昕同史树明
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1