【技术实现步骤摘要】
提高神经机器翻译准确度的方法、翻译方法及系统和设备
本专利技术涉及机器翻译领域,具体涉及一种提高神经机器翻译准确度的方法、翻译方法及系统和设备。
技术介绍
机器翻译就是用计算机来实现不同语言之间的转换。被翻译的语言通常称为源语言,翻译成的结果语言称为目标语言。机器翻译就是实现从源语言到目标语言转换的过程。神经机器翻译是近些年来出现的最新的机器翻译方法,在翻译质量上,较原有的统计机器翻译方法有了一个显著的提升。相比于之前的统计机器翻译方法,神经机器翻译所需的工程设计更少,翻译效果也更好。当其首次被提出时,便在中等规模的公共基准数据集上就达到了可与统计方法相媲美的准确度。自此以后,研究者已经提出了很多改进神经机器翻译的技术,如今在翻译质量上已经大大超越了统计方法,包括Google翻译和百度翻译在内的诸多业内公司都在近期将自己的翻译系统从基于统计的方法更新为基于神经网络的方法,并广受好评。然而,机器翻译还远未得到完全解决。神经机器翻译虽然表现卓著,但仍然会做出一些人类翻译者不会做出的重大错误,其中最显著的错误是漏翻和重翻。所谓漏翻,是指机器在翻译源语言时,源语言中的某些 ...
【技术保护点】
一种提高神经机器翻译准确度的方法,其特征在于,在翻译前对源语言进行预调序;具体包括:利用双语训练数据训练预调序模型;利用所述预调序模型,对原始的源语言进行调序,使之接近目标语言的词序;利用调序过的源语言代替所述原始的源语言,对神经机器翻译模型进行训练。
【技术特征摘要】
1.一种提高神经机器翻译准确度的方法,其特征在于,在翻译前对源语言进行预调序;具体包括:利用双语训练数据训练预调序模型;利用所述预调序模型,对原始的源语言进行调序,使之接近目标语言的词序;利用调序过的源语言代替所述原始的源语言,对神经机器翻译模型进行训练。2.根据权利要求1所述的方法,其特征在于,在“利用所述预调序模型,对原始的源语言进行调序,使之接近目标语言的词序”之后,在“利用调序过的源语言代替所述原始的源语言,对神经机器翻译模型进行训练”之前,还包括:在所述神经机器翻译模型的注意力层中加入位置向量,将基于隐层状态的注意力模型扩展为基于隐层状态和位置向量的混合注意力模型。3.根据权利要求2所述的方法,其特征在于,在“在所述神经机器翻译模型的注意力层中加入位置向量,将基于隐层状态的注意力模型扩展为基于隐层状态和位置向量的混合注意力模型”之后,在“利用调序过的源语言代替所述原始的源语言,对神经机器翻...
【专利技术属性】
技术研发人员:张家俊,赵阳,宗成庆,
申请(专利权)人:中国科学院自动化研究所,波音中国投资有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。