一种基于双向多角度匹配的机器翻译方法技术

技术编号:37983844 阅读:22 留言:0更新日期:2023-06-30 09:58
本发明专利技术属于自动翻译领域,具体说是一种基于双向多角度匹配的机器翻译方法。包括以下步骤:构建机器翻译模型,并使用词库中的样本数据对模型进行训练;将待翻译语句输入到训练好的模型中,得到翻译后的语句。所述机器翻译模型包括顺次连接的词向量表示层、内容表示层、匹配层、聚合层以及预测层。本发明专利技术是从两个方向上上匹配两个句子。而在每个单独的方向上,使用多角度匹配两个句子。本发明专利技术在结果整合处理方面,用一个Bi

【技术实现步骤摘要】
一种基于双向多角度匹配的机器翻译方法


[0001]本专利技术属于自动翻译领域,具体说是一种基于双向多角度匹配的机器翻译方法。

技术介绍

[0002]从1949年翻译备忘录提出到现在,大约过了七十多年。这期间,机器翻译经历了多个不同的发展阶段,也涌现出了很多方法。总结起来主要有三类,一开始是基于规则的方法,然后发展为基于统计的方法。一直到最近几年出现的基于神经网络的方法。
[0003]基于规则的翻译,是指通过人类语言学家来写规则,这一个词翻译成另外一个词、这个成分翻译成另外一个成分,在句子中的出现在什么位置,都用规则表示出来。这种方法的优点是直接用语言学专家知识,准确率非常高。缺点是它的成本很高,比如说要开发中文和英文的翻译系统,需要找同时会中文和英文的语言学家。要开发另外一种语言的翻译系统,就要再找懂另外一种语言的语言学家。因此,基于规则的系统开发周期很长,成本很高。此外,还面临规则冲突的问题。随着规则数量的增多,规则之间互相制约和影响。有时为了解决一个问题而写的一个规则,可能会引起其他句子的翻译,带来一系列问题。而为了解决这一系列问题本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于双向多角度匹配的机器翻译方法,其特征在于,包括以下步骤:构建机器翻译模型,并使用词库中的样本数据对模型进行训练;将待翻译语句输入到训练好的模型中,得到翻译后的语句。2.根据权利要求1所述的一种基于双向多角度匹配的机器翻译方法,其特征在于,将所述样本数据构建为三元组的形式(P,Q,y)的形式,其中P表示长度为M的句子序列,Q表示长度为N的句子序列,y表示P和Q之间关系的标签。3.根据权利要求1所述的一种基于双向多角度匹配的机器翻译方法,其特征在于,所述机器翻译模型包括顺次连接的词向量表示层、内容表示层、匹配层、聚合层以及预测层,其中:词向量表示层将输入的句子序列P和句子序列Q按照时间步分为多个单词,将每个单词里面的每个字符向量输入LSTM网络得到词向量;内容表示层根据句子序列P和句子序列Q的时间步顺序,将分别句子序列P和句子序列Q的词向量组成句子,构成句子序列P和句子序列Q的上下文向量;匹配层使用多角度表达的匹配方法对句子序列P句子序列和Q的上下文向量进行双向比较,得到正向匹配向量序列和反向匹配向量序列;聚合层将正向匹配向量序列和反向匹配向量序列聚合后,输入Bi

LSTM神经网络,得到最终的匹配向量;预测层将最终的匹配向量依次通过两层前馈神经网络和softmax分类函数,得到预测概率Pr(y|P;Q),作为三元组中的y。4.根据权利要求3所述的一种基于双向多角度匹配的机器翻译方法,其特征在于,所述使用多角度表达的匹配方法对句子序列P句子序列和Q的上下文向量进行双向比较,包括以下步骤:使用四种匹配策略分别对句子序列P的每一个时间步进行匹配,得到四个向量序列,将四个向量序列首尾相...

【专利技术属性】
技术研发人员:张悦王海鹏杜振军唐忠华贾凯
申请(专利权)人:沈阳新松机器人自动化股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1