【技术实现步骤摘要】
翻译方法及装置
本专利技术涉及翻译
,具体而言,涉及一种翻译方法及装置。
技术介绍
随着技术的发展,各种翻译工具已上线了神经网络翻译系统,简称NMT模型,干预机制是支持线上翻译场景的基本必备机制,可以用于对误翻译的修复,以及提高场景内的专业术语和商品核心关键信息的翻译准确度等重要问题,当前翻译干预机制实现了基于标签替换的硬干预,上线后对于NMT具备了基本的干预能力,效果明显。但是存在以下缺点:1)基于标签替换的硬干预的方式会使翻译过程损失原文信息,导致译文忠诚度和流畅度的下降,这种方式只能保证干预译文片段出现在最终译文中,但对整体译文的质量有较大损失。2)基于标签的硬干预方式不具备消歧能力,针对一个源语言片段,只能给出一种固定的干预译文,不能从多个给定候选译文中选择最适合当前语境的译文。3)当一个句子中待干预片段较多时,基于标签替换的方式不能保证所有待干预片段都在最终译文中生效,生效比率取决于源端句子中的干预标签在译文中被成功预测出来的比率。相关技术中的翻译方法较单一,难以针对不同的翻译内容进行翻译方式的选择。 ...
【技术保护点】
1.一种翻译方法,其特征在于,包括:/n获取源端句子,其中,所述源端句子为输入到神经网络中的待翻译的句子,所述神经网络用于将所述源端句子从源语言翻译成目标语言;/n在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式,其中,所述翻译方式包括以下之一:从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文、使用所述神经网络生成所述目标词汇的目标译文,所述干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;/n根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译。/n
【技术特征摘要】
1.一种翻译方法,其特征在于,包括:
获取源端句子,其中,所述源端句子为输入到神经网络中的待翻译的句子,所述神经网络用于将所述源端句子从源语言翻译成目标语言;
在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式,其中,所述翻译方式包括以下之一:从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文、使用所述神经网络生成所述目标词汇的目标译文,所述干预译文为指定将所述目标词汇从源语言翻译成预定的目标语言;
根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译。
2.根据权利要求1所述的方法,其特征在于,获取所述源端句子包括:
获取待翻译的原始句子;
将所述原始句子中的目标词汇用对应的干预译文替换;
将替换后得到的句子作为所述源端句子。
3.根据权利要求2所述的方法,其特征在于,将所述原始句子中的目标词汇用对应的干预译文替换包括:
获取存在所述干预译文的片段对应的第一向量;
获取所述干预译文对应的第二向量;
将所述第一向量替换为所述第二向量,其中,所述源端句子转换后得到的一组向量。
4.根据权利要求3所述的方法,其特征在于,将所述原始句子中的目标词汇用对应的干预译文替换包括:
获取存在所述干预译文的片段对应的第一向量包括:从所述源语言的词嵌入矩阵中获取存在所述干预译文的片段对应的第一向量;
获取所述干预译文对应的第二向量包括:从所述目标语言的词嵌入矩阵中获取所述干预译文对应的第二向量,其中,所述源端句子经过所述源语言的词嵌入处理后得到的一组向量。
5.根据权利要求1至4中任一项所述的方法,其特征在于,在使用所述神经网络将所述源端句子中的目标词汇翻译成目标译文之前,选择对所述目标词汇的翻译方式包括:
通过训练得到的分类器选择对所述目标词汇进行翻译的方式。
6.根据权利要求1中所述的方法,其特征在于,若选择出的翻译方式为使用所述神经网络生成所述目标词汇的目标译文,根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译包括:
使用所述神经网络对所述源端句子中的目标词汇进行预测,使用预测出的词语替代所述源端句子中的目标词汇。
7.根据权利要求1中所述的方法,其特征在于,若选择出的翻译方式为从所述源端句子中的目标词汇对应的干预译文中确定作为所述目标词汇的目标译文,根据选择出的所述翻译方式对所述源端句子中的目标词汇进行翻译包括:
在...
【专利技术属性】
技术研发人员:宋楷,于恒,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。