翻译方法及装置制造方法及图纸

技术编号:23558619 阅读:16 留言:0更新日期:2020-03-25 04:07
本发明专利技术公开了一种翻译方法及装置。该方法包括:获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将源端句子从源语言翻译成目标语言;在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将目标词汇从源语言翻译成预定的目标语言;根据选择出的翻译方式对源端句子中的目标词汇进行翻译,本发明专利技术解决了由于相关技术中翻译方法较单一,难以针对翻译内容进行翻译方式的选择的技术问题。

Translation methods and devices

【技术实现步骤摘要】
翻译方法及装置
本专利技术涉及翻译
,具体而言,涉及一种翻译方法及装置。
技术介绍
随着技术的发展,各种翻译工具已上线了神经网络翻译系统,简称NMT模型,干预机制是支持线上翻译场景的基本必备机制,可以用于对误翻译的修复,以及提高场景内的专业术语和商品核心关键信息的翻译准确度等重要问题,当前翻译干预机制实现了基于标签替换的硬干预,上线后对于NMT具备了基本的干预能力,效果明显。但是存在以下缺点:1)基于标签替换的硬干预的方式会使翻译过程损失原文信息,导致译文忠诚度和流畅度的下降,这种方式只能保证干预译文片段出现在最终译文中,但对整体译文的质量有较大损失。2)基于标签的硬干预方式不具备消歧能力,针对一个源语言片段,只能给出一种固定的干预译文,不能从多个给定候选译文中选择最适合当前语境的译文。3)当一个句子中待干预片段较多时,基于标签替换的方式不能保证所有待干预片段都在最终译文中生效,生效比率取决于源端句子中的干预标签在译文中被成功预测出来的比率。相关技术中的翻译方法较单一,难以针对不同的翻译内容进行翻译方式的选择。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种翻译方法及装置,以至少解决由于相关技术中翻译方法较单一,难以针对翻译内容进行翻译方式的选择的技术问题。根据本专利技术实施例的一个方面,提供了一种翻译方法,包括:获取源端句子,其中,所述源端句子为输入到神经网络中的待翻译的句子,所述神经网络用于将所述源端句子从源语言翻译成目标语言;在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式,其中,所述翻译方式包括以下之一:从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文、使用所述神经网络生成所述目标词汇的目标译文,所述干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译。进一步地,获取所述源端句子包括:获取待翻译的原始句子;将所述原始句子中的目标词汇用对应的干预译文替换;将替换后得到的句子作为所述源端句子。进一步地,将所述原始句子中的目标词汇用对应的干预译文替换包括:获取存在所述干预译文的片段对应的第一向量;获取所述干预译文对应的第二向量;将所述第一向量替换为所述第二向量,其中,所述源端句子转换后得到的一组向量。进一步地,将所述原始句子中的目标词汇用对应的干预译文替换包括:获取存在所述干预译文的片段对应的第一向量包括:从所述源语言的词嵌入矩阵中获取存在所述干预译文的片段对应的第一向量;获取所述干预译文对应的第二向量包括:从所述目标语言的词嵌入矩阵中获取所述干预译文对应的第二向量,其中,所述源端句子经过所述源语言的词嵌入处理后得到的一组向量。进一步地,在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式包括:通过训练得到的分类器选择对所述目标词汇进行翻译的方式。进一步地,若选择出的翻译方式为使用所述神经网络生成所述目标词汇的目标译文,根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译包括:使用所述神经网络对所述源端句子中的目标词汇进行预测,使用预测出的词语替代所述源端句子中的目标词汇。进一步地,若选择出的翻译方式为从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文,根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译包括:在预设目标词汇库中查询所述源端句子中的目标词汇对应的词汇;采用查询到的词汇替代所述源端句子中的目标词汇。根据本专利技术实施例的另一方面,还提供了一种翻译装置,包括:获取单元,用于获取源端句子,其中,所述源端句子为输入到神经网络中的待翻译的句子,所述神经网络用于将所述源端句子从源语言翻译成目标语言;选择单元,用于在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式,其中,所述翻译方式包括以下之一:从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文、使用所述神经网络生成所述目标词汇的目标译文,所述干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;翻译单元,用于根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译。进一步地,所述获取单元包括:第一获取模块,用于获取待翻译的原始句子;第一替换模块,用于将所述原始句子中的目标词汇用对应的干预译文替换;确定模块,用于将替换后得到的句子作为所述源端句子。进一步地,所述第一替换模块包括:第一获取子模块,用于获取存在所述干预译文的片段对应的第一向量;第二获取子模块,用于获取所述干预译文对应的第二向量;替换子模块,用于将所述第一向量替换为所述第二向量,其中,所述源端句子转换后得到的一组向量。进一步地,所述第一替换模块包括:第三获取子模块,用于获取存在所述干预译文的片段对应的第一向量包括:从所述源语言的词嵌入矩阵中获取存在所述干预译文的片段对应的第一向量;第四获取子模块,用于获取所述干预译文对应的第二向量包括:从所述目标语言的词嵌入矩阵中获取所述干预译文对应的第二向量,其中,所述源端句子经过所述源语言的词嵌入处理后得到的一组向量。进一步地,所述选择单元包括:选择模块,用于通过训练得到的分类器选择对所述目标词汇进行翻译的方式。进一步地,若选择出的翻译方式为从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文,所述翻译单元还包括:查询模块,用于在预设目标词汇库中查询所述源端句子中的目标词汇对应的词汇;第二替换模块,用于采用查询到的词汇替代所述源端句子中的目标词汇。在本专利技术实施例中,通过获取源端句子,其中,源端句子为输入到神经网络中的待翻译的句子,神经网络用于将所述源端句子从源语言翻译成目标语言;在使用神经网络将源端句子中的目标词汇翻译成目标译文之前,选择对目标词汇的翻译方式,其中,翻译方式包括以下之一:从源端句子中的目标词汇对应的干预译文中确定作为目标词汇的目标译文、使用神经网络生成目标词汇的目标译文,干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;根据选择出的翻译方式对源端句子中的目标词汇进行翻译,达到了可以选择对源端句子的目标词汇的翻译方式的目的,从而实现了增添对翻译方法的选择,可以根据具体地源端句子中的目标词汇选择对应的翻译方式从而获得最适合的译文,形成“软”干预,提升翻译准确率的技术效果。进而解决了由于相关技术中翻译方法较单一,难以针对翻译内容进行翻译方式的选择的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种翻译方法的流程图;图2是根据本专利技术实施例的一种翻译装置的示意图;图3是根据本专利技术实施例的计算机终端的硬件结构框图;以及图4是根据本发本文档来自技高网...

【技术保护点】
1.一种翻译方法,其特征在于,包括:/n获取源端句子,其中,所述源端句子为输入到神经网络中的待翻译的句子,所述神经网络用于将所述源端句子从源语言翻译成目标语言;/n在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式,其中,所述翻译方式包括以下之一:从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文、使用所述神经网络生成所述目标词汇的目标译文,所述干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;/n根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译。/n

【技术特征摘要】
1.一种翻译方法,其特征在于,包括:
获取源端句子,其中,所述源端句子为输入到神经网络中的待翻译的句子,所述神经网络用于将所述源端句子从源语言翻译成目标语言;
在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式,其中,所述翻译方式包括以下之一:从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文、使用所述神经网络生成所述目标词汇的目标译文,所述干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;
根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译。


2.根据权利要求1所述的方法,其特征在于,获取所述源端句子包括:
获取待翻译的原始句子;
将所述原始句子中的目标词汇用对应的干预译文替换;
将替换后得到的句子作为所述源端句子。


3.根据权利要求2所述的方法,其特征在于,将所述原始句子中的目标词汇用对应的干预译文替换包括:
获取存在所述干预译文的片段对应的第一向量;
获取所述干预译文对应的第二向量;
将所述第一向量替换为所述第二向量,其中,所述源端句子转换后得到的一组向量。


4.根据权利要求3所述的方法,其特征在于,将所述原始句子中的目标词汇用对应的干预译文替换包括:
获取存在所述干预译文的片段对应的第一向量包括:从所述源语言的词嵌入矩阵中获取存在所述干预译文的片段对应的第一向量;
获取所述干预译文对应的第二向量包括:从所述目标语言的词嵌入矩阵中获取所述干预译文对应的第二向量,其中,所述源端句子经过所述源语言的词嵌入处理后得到的一组向量。


5.根据权利要求1至4中任一项所述的方法,其特征在于,在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式包括:
通过训练得到的分类器选择对所述目标词汇进行翻译的方式。


6.根据权利要求1中所述的方法,其特征在于,若选择出的翻译方式为使用所述神经网络生成所述目标词汇的目标译文,根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译包括:
使用所述神经网络对所述源端句子中的目标词汇进行预测,使用预测出的词语替代所述源端句子中的目标词汇。


7.根据权利要求1中所述的方法,其特征在于,若选择出的翻译方式为从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文,根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译包括:
在...

【专利技术属性】
技术研发人员:宋楷于恒
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1