基于神经网络模型的翻译方法及装置制造方法及图纸

技术编号：12344169 阅读：96 留言：0更新日期：2015-11-18 17:23

本发明专利技术实施例提供了一种基于神经网络模型的翻译方法及装置。其中，基于神经网络模型的翻译方法包括：获取源语言的语句；将所述源语言的语句进行编码得到向量序列；基于所述向量序列逐词地预测目标语言中相应的候选词；根据预测得到的候选词生成目标语言的语句。本发明专利技术实施例的基于神经网络模型的翻译方法及装置，能够结合多种翻译特征执行翻译，提高了翻译结果的翻译质量、流利程度以及可读性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器翻译
，尤其涉及一种基于神经网络模型的翻译方法及装置。
技术介绍
近年来，循环神经网络（Recurrent Neural Network，RNN)技术被广泛应用于机器翻译领域。与传统的统计机器翻译系统相比，基于循环神经网络的机器翻译系统能够充分利用全局语义信息，翻译质量显著提升。然而，基于循环神经网络的机器翻译技术也存在着明显的不足之处： -、词表受限。通常，RNN翻译模型仅能使用一个数量有限的单词词表（通常三万单词以内），导致词表外单词（0ut-〇f-vocabulary，00V)无法翻译。二、RNN翻译模型仅支持双语语句对进行训练，难以利用可有效提高翻译结果流利度的目标语言单语语料进行训练。三、无法增加或丰富更多的特征。具体来说，传统的统计机器翻译方法是基于多种特征执行翻译处理的，对于每一个翻译单元（单词、短语、翻译规则等）均计算每个特征的得分，最终结合多个特征的得分来确定最优翻译结果。然而，这些能够提高翻译质量的特征无法直接为RNN翻译模型所用。四、漏词现象严重，易生成较短翻译结果，影响翻译结果的可读性。
技术实现思路
本专利技术实施例的目的在于，提供一种基于神经网络模型的翻译方法及装置，结合多种翻译特征执行翻译，以提高翻译结果的翻译准确性。为实现上述专利技术目的，本专利技术的实施例提供了一种基于神经网络模型的翻译方法，包括：获取源语言的语句；将所述源语言的语句进行编码，得到向量序列；基于所述向量序列逐词地预测目标语言中相应的候选词；根据预测得到的候选词生成目标语言的语句，其...
基于神经网络模型的翻译方法及装置

【技术保护点】
一种基于神经网络模型的翻译方法，其特征在于，所述方法包括：获取源语言的语句；将所述源语言的语句进行编码，得到向量序列；基于所述向量序列逐词地预测目标语言中相应的候选词；根据预测得到的候选词生成目标语言的语句，其中，在任一所述候选词的预测处理中，从预设的翻译词表中获取多个初选词，并且基于对数线性模型计算每个所述初选词的翻译概率，以根据所述翻译概率从所述多个初选词选取所述候选词，所述对数线性模型根据神经网络翻译模型的翻译特征和统计机器翻译模型的翻译特征建立的。

【技术特征摘要】

【专利技术属性】
技术研发人员：何中军，和为，吴华，王海峰，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人