基于神经网络模型的翻译方法及装置制造方法及图纸

技术编号:12344169 阅读:96 留言:0更新日期:2015-11-18 17:23
本发明专利技术实施例提供了一种基于神经网络模型的翻译方法及装置。其中,基于神经网络模型的翻译方法包括:获取源语言的语句;将所述源语言的语句进行编码得到向量序列;基于所述向量序列逐词地预测目标语言中相应的候选词;根据预测得到的候选词生成目标语言的语句。本发明专利技术实施例的基于神经网络模型的翻译方法及装置,能够结合多种翻译特征执行翻译,提高了翻译结果的翻译质量、流利程度以及可读性。

【技术实现步骤摘要】

本专利技术涉及机器翻译
,尤其涉及一种基于神经网络模型的翻译方法及装 置。
技术介绍
近年来,循环神经网络(Recurrent Neural Network,RNN)技术被广泛应用于机器 翻译领域。与传统的统计机器翻译系统相比,基于循环神经网络的机器翻译系统能够充分 利用全局语义信息,翻译质量显著提升。 然而,基于循环神经网络的机器翻译技术也存在着明显的不足之处: -、词表受限。 通常,RNN翻译模型仅能使用一个数量有限的单词词表(通常三万单词以内),导 致词表外单词(0ut-〇f-vocabulary,00V)无法翻译。 二、RNN翻译模型仅支持双语语句对进行训练,难以利用可有效提高翻译结果流利 度的目标语言单语语料进行训练。 三、无法增加或丰富更多的特征。 具体来说,传统的统计机器翻译方法是基于多种特征执行翻译处理的,对于每一 个翻译单元(单词、短语、翻译规则等)均计算每个特征的得分,最终结合多个特征的得分 来确定最优翻译结果。然而,这些能够提高翻译质量的特征无法直接为RNN翻译模型所用。 四、漏词现象严重,易生成较短翻译结果,影响翻译结果的可读性。
技术实现思路
本专利技术实施例的目的在于,提供一种基于神经网络模型的翻译方法及装置,结合 多种翻译特征执行翻译,以提高翻译结果的翻译准确性。 为实现上述专利技术目的,本专利技术的实施例提供了一种基于神经网络模型的翻译方 法,包括:获取源语言的语句;将所述源语言的语句进行编码,得到向量序列;基于所述向 量序列逐词地预测目标语言中相应的候选词;根据预测得到的候选词生成目标语言的语 句,其中,在任一所述候选词的预测处理中,从预设的翻译词表中获取多个初选词,并且基 于对数线性模型计算每个所述初选词的翻译概率,以根据所述翻译概率从所述多个初选词 选取所述候选词,所述对数线性模型根据神经网络翻译模型的翻译特征和统计机器翻译模 型的翻译特征建立的。 优选地,所述从预设的翻译词表中获取多个初选词,并且基于对数线性模型计算 每个所述初选词的翻译概率,以根据所述翻译概率从所述多个初选词选取所述候选词的处 理包括:从预设的翻译词表中获取M个词语作为初选词,M为正整数;根据所述向量序列和 在获取M个初选词之前预测出的候选词,计算每个所述初选词的神经网络翻译模型的翻译 特征;计算每个所述初选词的统计机器翻译模型的翻译特征;根据计算得到的神经网络翻 译模型的翻译特征和统计机器翻译模型的翻译特征,结合所述对数线性模型计算每个所述 初选词的翻译概率值;对计算得到的M个翻译概率值进行排序,并将与前N位的翻译概率值 相应的初选词选取为所述候选词,N为正整数,且N < M。 优选地,所述基于所述向量序列逐词地预测目标语言中相应的候选词的处理还包 括:依据所述神经网络翻译模型的翻译特征标记所述候选词之间的关联关系,所述根据预 测得到的候选词生成目标语言的语句的处理包括:根据具有关联关系的所有候选词生成目 标语言的语句。 优选地,所述统计机器翻译模型的翻译特征包括双向单词翻译模型特征。 优选地,所述统计机器翻译模型的翻译特征还包括N元语言模型特征和/或词惩 罚特征。 优选地,所述将所述源语言的语句进行编码得到向量序列的处理包括:对源语言 的语句进行分词,将分得的多个分词分别转换成与每个所述分词对应的词向量,由多个分 词各自对应的词向量得到所述向量序列。 优选地,所述获取源语言的语句的处理包括以下处理之一:接收文本数据,并将所 述文本数据作为所述源语言的语句;接收语音数据,对所述语音数据进行语音识别得到经 语音识别的文本数据,并将所述经语音识别的文本数据作为所述源语言的语句;接收图片 数据,对所述图片数据进行光学字符识别OCR得到经OCR识别的文本数据,并将所述经OCR 识别的文本数据作为所述源语言的语句。 本专利技术的实施例还提供了一种基于神经网络模型的翻译装置,包括:语句获取模 块,用于获取源语言的语句;语句编码模块,用于将所述源语言的语句进行编码得到向量序 列;候选词预测模块,用于基于所述向量序列逐词地预测目标语言中相应的候选词;语句 生成模块,用于根据预测得到的候选词生成目标语言的语句,其中,在任一所述候选词的预 测处理中,从预设的翻译词表中获取多个初选词,并且基于对数线性模型计算每个所述初 选词的翻译概率,以根据所述翻译概率从所述多个初选词选取所述候选词,所述对数线性 模型根据神经网络翻译模型的翻译特征和统计机器翻译模型的翻译特征建立的。 优选地,所述候选词预测模块包括:初选词获取单元,用于从预设的翻译词表中获 取M个词语作为初选词,M为正整数;神经网络模型特征计算单元,用于根据所述向量序列 和在获取M个初选词之前预测出的候选词,计算每个所述初选词的神经网络翻译模型的翻 译特征;统计机器模型特征计算单元,用于计算每个所述初选词的统计机器翻译模型的翻 译特征;翻译概率计算单元,用于根据计算得到的神经网络翻译模型的翻译特征和统计机 器翻译模型的翻译特征,结合所述对数线性模型计算每个所述初选词的翻译概率值;候选 词选取单元,用于对计算得到的M个翻译概率值进行排序,并将与前N位的翻译概率值相应 的初选词选取为所述候选词,N为正整数,且N < M。 优选地,所述候选词预测模块还包括:候选词关联单元,用于依据所述神经网络翻 译模型的翻译特征标记所述候选词之间的关联关系,所述语句生成模块,用于根据具有关 联关系的所有候选词生成目标语言的语句。 优选地,所述统计机器翻译模型的翻译特征包括双向单词翻译模型特征。 优选地,所述统计机器翻译模型的翻译特征还包括N元语言模型特征和/或词惩 罚特征。 优选地,所述语句编码模块用于对源语言的语句进行分词,将分得的多个分词分 别转换成与每个所述分词对应的词向量,由多个分词各自对应的词向量得到所述向量序 列。 优选地,所述语句获取模块包括以下单元之一:文本数据接收单元,用于接收文本 数据,并将所述文本数据作为所述源语言的语句;语音数据接收及识别单元,用于接收语音 数据,对所述语音数据进行语音识别得到经语音识别的文本数据,并将所述经语音识别的 文本数据作为所述源语言的语句;图片数据接收及识别单元,用于接收图片数据,对所述图 片数据进行光学字符识别OCR得到经OCR识别的文本数据,并将所述经OCR识别的文本数 据作为所述源语言的语句。 本专利技术实施例提供的基于神经网络模型的翻译方法及装置,对获取到的源语言的 语句进行编码得到向量序列,再基于向量序列逐词地预测目标语言中相应的候选词,在任 一所述候选词的预测处理过程中,利用对数线性模型,将统计机器翻译模型的翻译特征引 入神经网络翻译模型,从而计算从预设的翻译词表中获取的每个初选词的翻译概率,由此 基于翻译概率计算结果从多个初选词中选取候选词,最终根据预测的候选词自动地生成目 标语言的语句,极大地提高了翻译的准确性、可读性及流畅性。同时,生成的翻译结果长度 适宜,降低了漏词率。【附图说明】 图1是示出本专利技术实施例一的基于神经网络模型的翻译方法的流程图; 图2是示出本专利技术实施例一的基于神经网络模型的翻译方法中神经网络翻译模 型的应用场景示例性示意图; 图3是示出本专利技术实施例一的基于神经当前第1页1&n本文档来自技高网...
基于神经网络模型的翻译方法及装置

【技术保护点】
一种基于神经网络模型的翻译方法,其特征在于,所述方法包括:获取源语言的语句;将所述源语言的语句进行编码,得到向量序列;基于所述向量序列逐词地预测目标语言中相应的候选词;根据预测得到的候选词生成目标语言的语句,其中,在任一所述候选词的预测处理中,从预设的翻译词表中获取多个初选词,并且基于对数线性模型计算每个所述初选词的翻译概率,以根据所述翻译概率从所述多个初选词选取所述候选词,所述对数线性模型根据神经网络翻译模型的翻译特征和统计机器翻译模型的翻译特征建立的。

【技术特征摘要】

【专利技术属性】
技术研发人员:何中军和为吴华王海峰
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1