一种自动译后编辑机制的多语言神经机器翻译方法技术

技术编号:45460809 阅读:11 留言:0更新日期:2025-06-06 21:53
本发明专利技术公开了一种自动译后编辑机制的多语言神经机器翻译方法,本方法涉及深度学习和自然语言处理领域。针对现有的多语言神经机器翻译方法应用在翻译任务时产生翻译错误的问题,本发明专利技术提出了一种以多源Transformer为基本框架,首先使用神经机器翻译模型处理第一语言文本后生成的第二语言文本,其次通过回译的方式处理第二语言文本生成第一语言的训练文本,最后自动生成包含第一语言基准真值文本和第一语言训练文本的训练实例进行训练。根据这三个功能模块化制成一种自动译后翻译机制的多语言神经机器翻译方法。本发明专利技术能显著矫正多语言神经机器翻译模型产生的错误,提升多语言神经机器翻译性能。

【技术实现步骤摘要】

本专利技术涉及一种自动译后编辑机制的多语言神经机器翻译方法,属于自然语言处理。


技术介绍

1、机器翻译能够进行不同语言文本的单词替换,实现第一语言向第二语言的翻译。但是,源语言文本中的词组可能具有特定的含义,简单的进行词对词的替换会造成翻译的不精确,人工进行译后编辑产生了昂贵的人工成本。这为机器翻译模型的普及产生了重大的阻碍。

2、神经机器翻译使用人造神经网络来预测单词的可能性排序,将不同语言的知识通过共享语义空间的方式进行匹配,能够有效的利用文本的整体输入,一次翻译整个短语或句子,而非单个的字或词。然而在现有的多语言神经机器翻译模型中,共享语言知识的同时会引入语种间的干扰,这种存在于网络层面和参数层面的干扰同样对翻译效果造成影响。

3、译后编辑作为目前神经机器翻译技术的重要一环,需要将译文中不恰当部分进行校正,然而目前的译后编辑方法存在着准确性较低,效果较差,编辑过程中过于依赖人工辅助的问题。针对该问题,本专利技术提出了一种自动译后编辑模型的多语言神经机器翻译方法。


技术实现思路b>

1本文档来自技高网...

【技术保护点】

1.自动译后编辑机制的多语言神经机器翻译方法,其特征在于,包括:

2.根据权利要求1所述的自动译后编辑机制的多语言神经机器翻译方法,其特征在于,所述S12包括:

3.根据权利要求1所述的自动译后编辑机制的多语言神经机器翻译方法,其特征在于,所述S13包括:

4.根据权利要求1所述的自动译后编辑机制的多语言神经机器翻译方法,其特征在于,所述S14包括:

【技术特征摘要】

1.自动译后编辑机制的多语言神经机器翻译方法,其特征在于,包括:

2.根据权利要求1所述的自动译后编辑机制的多语言神经机器翻译方法,其特征在于,所述s12包括:

3.根据...

【专利技术属性】
技术研发人员:王志宇王校伟刘霞王琦王进科
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1