The embodiment of the invention discloses a device and translation method based on neural network, the method comprises: acquiring the initial translation to the translation of the sentence, the initial carrying unknown words; the unknown words in the translation to split the original word, and the word sequence are split words consisting of the first neural input network; word vector for each word in the word sequence through the first multilayer neural network, and all the word vector sequences of words input second multilayer neural network; database commonly used word second multilayer neural network and preset, encoding of all word vectors to obtain semantic vector; the semantic vector input third multilayer neural network, through the third multi-layer neural networks to semantic vector decode and final translation translation to the translation of the sentence with the initial translation of the sentence to be determined. The invention has the advantages of improving the operability of the translation of the unknown words, reducing the translation cost of Machine Translation, and improving the translation quality of Machine Translation.
【技术实现步骤摘要】
一种基于神经网络的翻译方法及装置
本专利技术涉及通信
,尤其涉及一种基于神经网络的翻译方法及装置。
技术介绍
当前在统计机器翻译过程中,由于统计机器翻译的翻译模型是从训练数据中自动学习得到,对于没有在翻译模型训练的语料中出现过的词,翻译模型无法生成该词对应的翻译,从而出现未登录词的现象。其中,上述未登录词为未在翻译模型的训练的语料中出现过的词,翻译模型对其进行翻译得到的结果一般为原样输出或者输出为“未知(UNK)”。在统计机器翻译中,尤其是跨领域(比如在新闻领域的语料中训练得到的翻译模型用在通信领域中翻译)的机器翻译中,由于翻译模型训练的语料难以覆盖全部词汇,导致机器翻译结果中出现未登录词原样输出等现象的概率高,翻译效果差。现有技术一通过加大训练语料使得训练语料更多的覆盖多种语言学现象,以此提高机器翻译的准确率,降低出现未登录词的现象的概率。然而,加大训练语料需要更多的词语资源,需要更多的双语专家的人工参与,实现成本高,可操作性低。现有技术二借用词典进行直接翻译或者间接翻译,以期从词典中查找得到未登录词或者与未登录词语义相近的词语,通过借助词典来确定未登录词 ...
【技术保护点】
一种基于神经网络的翻译方法,其特征在于,包括:获取待翻译句子的初始译文,所述初始译文中携带未登录词;将所述初始译文中的未登录词拆分为字,并将所述未登录词拆分得到的字组成的字序列输入第一多层神经网络,所述字序列中包含至少一个字;通过所述第一多层神经网络获取所述字序列中每个字的字向量,并将所述字序列的所有字向量输入第二多层神经网络;使用所述第二多层神经网络和预置的常用词数据库,对所述所有字向量进行编码以获取所述字序列对应的语义向量;将所述语义向量输入第三多层神经网络,通过第三多层神经网络对所述语义向量进行解码并结合所述待翻译句子的初始译文确定所述待翻译句子的最终译文,所述最终译 ...
【技术特征摘要】
1.一种基于神经网络的翻译方法,其特征在于,包括:获取待翻译句子的初始译文,所述初始译文中携带未登录词;将所述初始译文中的未登录词拆分为字,并将所述未登录词拆分得到的字组成的字序列输入第一多层神经网络,所述字序列中包含至少一个字;通过所述第一多层神经网络获取所述字序列中每个字的字向量,并将所述字序列的所有字向量输入第二多层神经网络;使用所述第二多层神经网络和预置的常用词数据库,对所述所有字向量进行编码以获取所述字序列对应的语义向量;将所述语义向量输入第三多层神经网络,通过第三多层神经网络对所述语义向量进行解码并结合所述待翻译句子的初始译文确定所述待翻译句子的最终译文,所述最终译文中携带所述未登录词的译文。2.如权利要求1所述的翻译方法,其特征在于,所述预置的常用词数据库包括词典、语言学规则以及网络使用词数据库中的至少一种。3.如权利要求1或2所述的翻译方法,其特征在于,所述使用所述第二多层神经网络和预置的常用词数据库,对所述所有字向量进行编码以获取所述字序列对应的语义向量包括:使用所述第二多层神经网络根据所述常用词数据库提供的词汇信息确定所述字序列的字向量的至少一种组合方式,每个组合方式确定的字向量组合对应一个含义;将所述至少一种组合方式确定的至少一个字向量组合的至少一个含义进行压缩编码以得到所述语义向量。4.如权利要求3所述的翻译方法,其特征在于,所述通过第三多层神经网络对所述语义向量进行解码并结合所述待翻译句子的初始译文确定所述待翻译句子的最终译文包括:通过所述第三多层神经网络对所述语义向量进行解码以确定所述语义向量包含的至少一个含义,并根据所述初始译文中所述未登录词的上下文含义从所述语义向量包含的至少一个含义中选择目标含义;根据所述目标含义和所述初始译文中所述未登录词的上下文含义确定所述待翻译句子的最终译文。5.如权利要求1-4任一项所述的翻译方法,其特征在于,所述未登录词包括:缩略词、专有名词、派生词以及复合词中的至少一种。6.一种基于...
【专利技术属性】
技术研发人员:涂兆鹏,李航,姜文斌,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。