The invention discloses a neural network machine translation method and apparatus, which include: acquiring source statements to be translated; converting source statements into vector sequences; determining candidate objects corresponding to vector sequences according to the prefix tree obtained beforehand and constructed based on the target statement database; and determining the candidate objects to be translated according to the candidate objects. Target statement for translation result. Applying the scheme of the invention, the translation speed can be improved.
【技术实现步骤摘要】
神经网络机器翻译方法和装置
本专利技术涉及计算机应用技术,特别涉及神经网络机器翻译方法和装置。
技术介绍
循环神经网络及其衍生网络作为目前最流行的深度学习网络结构,凭借着有效记忆历史信息等特点,在图像识别、语音识别以及自然语言处理等方面得到了越来越广泛的应用。以翻译为例,神经网络机器翻译是近些年兴起的一种全新的机器翻译方式,相比于传统的统计翻译模型,翻译质量得到了很大地提升。神经网络机器翻译主要包括编码和解码两个过程,编码过程主要是指将待翻译的源语句转换为向量序列,解码过程主要是指根据向量序列确定出作为翻译结果的目标语句。比如,源语句可为一种语言,目标语句可为另外一种语言。其中,在解码过程中,在针对向量序列中的每个待翻译的词确定候选对象时,均需要针对词库中包括的所有词分别计算条件概率,而词库中包括的词的数量巨大,相应地,所需耗费的计算量也就会非常大,从而降低了翻译速度。
技术实现思路
有鉴于此,本专利技术提供了神经网络机器翻译方法和装置,能够提升翻译速度。具体技术方案如下:一种神经网络机器翻译方法,包括:获取待翻译的源语句;将所述源语句转换为向量序列;根据预先得到的、基于目标语句数据库所构建的前缀树,确定出所述向量序列对应的候选对象,根据所述候选对象确定出作为翻译结果的目标语句。一种神经网络机器翻译装置,包括:编码单元和解码单元;所述编码单元,用于获取待翻译的源语句,将所述源语句转换为向量序列,并将所述向量序列发送给所述解码单元;所述解码单元,用于根据预先得到的、基于目标语句数据库所构建的前缀树,确定出所述向量序列对应的候选对象,根据所述候选对象确 ...
【技术保护点】
1.一种神经网络机器翻译方法,其特征在于,包括:获取待翻译的源语句;将所述源语句转换为向量序列;根据预先得到的、基于目标语句数据库所构建的前缀树,确定出所述向量序列对应的候选对象,根据所述候选对象确定出作为翻译结果的目标语句。
【技术特征摘要】
1.一种神经网络机器翻译方法,其特征在于,包括:获取待翻译的源语句;将所述源语句转换为向量序列;根据预先得到的、基于目标语句数据库所构建的前缀树,确定出所述向量序列对应的候选对象,根据所述候选对象确定出作为翻译结果的目标语句。2.根据权利要求1所述的方法,其特征在于,所述将所述源语句转换为向量序列包括:通过门控递归单元GRU模型,将所述源语句转换为向量序列。3.根据权利要求1所述的方法,其特征在于,根据所述前缀树确定出所述向量序列对应的候选对象,根据所述候选对象确定出所述目标语句包括:针对所述向量序列中的各待翻译的词,依次进行以下处理:分别将最新获取到的各候选对象作为前缀,从所述前缀树中查找出位于所述前缀的下一级节点上的词,将查找出的词分别拼接在对应的前缀上,得到各初选对象;分别确定出各初选对象的条件概率,并按照条件概率的取值从大到小的顺序对各初选对象进行排序,将排序后处于前N位的初选对象作为候选对象,N为大于一的正整数;若确定所述向量序列中不存在下一个待翻译的词,则将最新获取到的、排序后处于前M位的候选对象作为所述目标语句输出,M为正整数,M小于或等于N。4.根据权利要求3所述的方法,其特征在于,该方法进一步包括:对于所述向量序列中的第一个待翻译的词,将所述前缀树中位于树根之后的第一级节点上的词均作为初选对象;分别确定出各初选对象的条件概率,并按照条件概率的取值从大到小的顺序对各初选对象进行排序,将排序后处于前N位的初选对象作为候选对象。5.根据权利要求3或4所述的方法,其特征在于,该方法进一步包括:针对排序后处于前N位的初始对象,从中筛选出条件概率大于预定阈值的初始对象,将筛选出的初始对象作为候选对象。6.根据权利要求3或4所述的方法,其特征在于,所述分别确定出各初选对象的条件概率包括:采用self-normalization算法,分别确定出各初选对象的条件概率。7.根据权利要求1、2、3或4所述的方法,其特征在于,在所述方法的执行过程中,当进行矩阵运算时,对于稀疏矩阵,采用向量拆分和线程池并行计算的方式进行矩阵运算,对于非稀疏矩阵,采用IntelMathKernelLibrary进行多线程并发的矩阵运算。8.根据权利要求1所述的方法,其特征在于,在图形处理器GPU...
【专利技术属性】
技术研发人员:严春伟,陈志杰,官瀚举,曹莹,张克丰,黄威,童牧晨玄,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。