一种GRU神经网络蒙汉机器翻译方法技术

技术编号:23213072 阅读:61 留言:0更新日期:2020-01-31 21:58
一种GRU神经网络蒙汉机器翻译方法,首先对翻译语言进行预处理,然后对一定规模的蒙汉双语进行Encoder‑Decoder模型的搭建和训练,并对蒙汉双语语料进行编码统一处理,最后基于Encoder‑Decoder模型得到翻译结果,Encoder‑Decoder模型由神经网络构建而成,其中一个神经网络为LSTM,负责Encoder编码,其采用双向编码设置,即对源语言进行正向编码和逆向编码,将源语句转换成两个不同方向编码且固定长度的向量,另一神经网络为GRU,负责Decoder解码,其从正向和逆向两个方向进行解码,即解码输出目标语言的时候会自动整合上下文信息,由此将编码生成的固定长度向量转换成目标语句,本发明专利技术结合蒙汉语言特点,使蒙汉机器翻译系统表达能力更加流畅,更接近人类表达,减少了翻译过程中语义丢失和翻译混乱的程度。

A method of Mongolian Chinese machine translation based on Gru neural network

【技术实现步骤摘要】
一种GRU神经网络蒙汉机器翻译方法
本专利技术属于机器翻译
,涉及蒙汉机器翻译,特别涉及一种GRU神经网络蒙汉机器翻译方法。
技术介绍
现阶段随着互联网行业的飞速发展,包括信息技术等一系列IT行业的不断崛起,而针对自然语言处理的机器翻译在对整个互联网行业的发展起到一定的促进作用。像谷歌,百度等大型的搜索服务行业面对行业的发展都针对机器翻译领域进行了较大规模的科研。为不断获得较高质量的译文不断研究。尽管科研机构为了获得更好的翻译效果仍然在不断地努力着,但是机器翻译随着
的发展仍然暴露出来越来越多的问题。例如,机器翻译比较生硬,其中的程序都是设计好,翻译中出现错误的概率非常的高,有时甚至出现各种语法错误。遇到比较长的段落翻译出来就很难理解,不符合正常的逻辑。翻译出的东西可读性比较差。同时也无法体现句子的语法特征,翻译出的稿件比较粗糙,生涩难懂。简单说就是语病百出,生硬难懂,只能进行简单的词语短句的翻译。而歧义词的处理和语法结构的差异而导致的译文质量低是机器翻译尤为突出的问题。现在全球很多著名的大学实验室都针对机器翻译领域存在的上本文档来自技高网...

【技术保护点】
1.一种GRU神经网络蒙汉机器翻译方法,首先对翻译语言进行预处理,然后对一定规模的蒙汉双语进行Encoder-Decoder模型的搭建和训练,并对蒙汉双语语料进行编码统一处理,最后基于Encoder-Decoder模型得到翻译结果,其特征在于,所述Encoder-Decoder模型是由神经网络构建而成的神经机器翻译模型,其中一个神经网络为LSTM,负责Encoder编码,其采用双向编码设置,即对源语言进行正向编码和逆向编码,将源语句转换成两个不同方向编码且固定长度的向量,两个待解码向量包含了所有的上下文信息,另外一个神经网络为GRU,负责Decoder解码,其从正向和逆向两个方向进行解码,即解...

【技术特征摘要】
1.一种GRU神经网络蒙汉机器翻译方法,首先对翻译语言进行预处理,然后对一定规模的蒙汉双语进行Encoder-Decoder模型的搭建和训练,并对蒙汉双语语料进行编码统一处理,最后基于Encoder-Decoder模型得到翻译结果,其特征在于,所述Encoder-Decoder模型是由神经网络构建而成的神经机器翻译模型,其中一个神经网络为LSTM,负责Encoder编码,其采用双向编码设置,即对源语言进行正向编码和逆向编码,将源语句转换成两个不同方向编码且固定长度的向量,两个待解码向量包含了所有的上下文信息,另外一个神经网络为GRU,负责Decoder解码,其从正向和逆向两个方向进行解码,即解码输出目标语言的时候会自动整合上下文信息,由此将编码生成的固定长度向量转换成目标语句。


2.根据权利要求1所述GRU神经网络蒙汉机器翻译方法,其特征在于,所述对翻译语言进行预处理是利用NLPIR分词技术对翻译语言进行分词。


3.根据权利要求3所述GRU神经网络蒙汉机器翻译方法,其特征在于,所述Encoder编码的计算公式为:
ht=f(xt,ht-1)
即,依据当前时刻的输入xt和上一时刻的隐藏层输出ht-1计算当前时刻的隐藏层输出ht,经过Encoder编码得到各个时刻的输出,进而计算得到最终源语句上下文的特征表示,即,以最终时刻的隐藏层输出表示源语句的上下文;
所述Decoder解码的计算公式为:



其中x1,…,xT是输入序列,y1,…,yT′是输出序列,V是解码器的初始值,即x1,…,xT,T是输入句子的长度,T’是输出句子长度,并且T和T’通常长度不致;
模型的目标函数为源语句正确翻译为目标语句的概率;
模型训练的过程即为将训练样本中源语句正确翻译为目标语句的概率最大化的过程,对于每个时刻i,当前输出为正确结果的概率计算如下
p(yi|{y1,…,yi-1})=g(yi-1,si,c)
其中g表示整个句子中间语义表示的变换函数,si是已经得到的特征向量,c是源语句上下文。


4.根据权利要求3所述GRU神经网络蒙汉机器翻译方法,其特征在于,所述Encoder-Decod...

【专利技术属性】
技术研发人员:苏依拉卞乐乐赵旭薛媛范婷婷张振
申请(专利权)人:内蒙古工业大学
类型:发明
国别省市:内蒙;15

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1