机器翻译方法、装置及存储介质制造方法及图纸

技术编号:26598925 阅读:24 留言:0更新日期:2020-12-04 21:21
本公开是关于一种机器翻译方法、装置及存储介质。该方法可以包括:获取待翻译篇章的篇章结构信息;其中,所述篇章结构信息,用于指示所述待翻译篇章的篇章结构;将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果。本公开可以将篇章结构信息和待翻译篇章的文本信息输入翻译模型,以得到翻译结果。由于篇章结构信息能够指示待翻译篇章的篇章结构,通过融合篇章结构信息的翻译模型对待翻译篇章进行翻译,这样,不仅能够对待翻译篇章中的各个句子进行翻译,还能将待翻译篇章的行文逻辑融合至翻译结果中,能够提高翻译结果的精确性。

【技术实现步骤摘要】
机器翻译方法、装置及存储介质
本公开涉及机器翻译领域,尤其涉及一种机器翻译方法、装置及存储介质。
技术介绍
在机器翻译领域,因受机器限制,普遍采用单句翻译的方法对待翻译篇章进行翻译,即依次建模待翻译篇章中的每个句子,并对其进行翻译。但是,由于是对待翻译篇章中的每个句子依次建模的,在翻译的过程中,没有考虑各个句子之间的关联性,会导致翻译结果不够精确。
技术实现思路
本公开提供一种机器翻译方法、装置及存储介质。根据本公开实施例的第一方面,提供一种机器翻译方法,包括:获取待翻译篇章的篇章结构信息;其中,所述篇章结构信息,用于指示所述待翻译篇章的篇章结构;将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果。可选的,所述获取待翻译篇章的篇章结构信息,包括:利用语义分割模型对所述待翻译篇章进行分割处理,得到M个基本篇章单元;其中,每个基本篇章单元包括N个词语;对所述M个基本篇章单元进行分析,得到篇章分析树;其中,所述篇章分析树用于表征各个基本篇章单元之间的篇章关系;根据所述篇章分析树中M个所述基本篇章单元所对应的M条篇章路径,确定所述篇章结构信息;其中,M和N均为正整数。可选的,所述将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果,包括:将所述文本信息输入所述翻译模型的第一类编码器,得到第一编码结果;将所述篇章结构信息输入所述翻译模型的由所述第一类编码器和全连接网络构成的第二类编码器,得到第二编码结果;根据所述第一编码结果和所述第二编码结果,得到所述翻译结果。可选的,所述根据所述第一编码结果和所述第二编码结果,得到所述翻译结果,包括:对所述第一编码结果和所述第二编码结果进行融合处理,得到目标编码结果;根据所述目标编码结果,得到所述翻译结果。可选的,所述根据所述目标编码结果,得到所述翻译结果,包括:根据所述目标编码结果,得到所述文本信息中每个词语的句子级别上下文;根据所述句子级别上下文,得到所述文本信息中每个词语的篇章级别上下文;通过插值方式将所述句子级别上下文、所述篇章级别上下文与所述文本信息进行融合,得到融合结果;将所述融合结果输入所述翻译模型的解码器,得到所述翻译结果。可选的,所述方法还包括:基于预设训练语料,对所述翻译模型进行训练,得到目标翻译模型;所述将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果,包括:将所述篇章结构信息和所述待翻译篇章的文本信息输入所述目标翻译模型,得到所述翻译结果。根据本公开实施例的第二方面,提供一种机器翻译装置,包括:获取模块,配置为获取待翻译篇章的篇章结构信息;其中,所述篇章结构信息,用于指示所述待翻译篇章的篇章结构;翻译模块,配置为将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果。可选的,所述获取模块,还配置为:利用语义分割模型对所述待翻译篇章进行分割处理,得到M个基本篇章单元;其中,每个基本篇章单元包括N个词语;对所述M个基本篇章单元进行分析,得到篇章分析树;其中,所述篇章分析树用于表征各个基本篇章单元之间的篇章关系;根据所述篇章分析树中M个所述基本篇章单元所对应的M条篇章路径,确定所述篇章结构信息;其中,M和N均为正整数。可选的,所述翻译模块,还配置为:将所述文本信息输入所述翻译模型的第一类编码器,得到第一编码结果;将所述篇章结构信息输入所述翻译模型的由所述第一类编码器和全连接网络构成的第二类编码器,得到第二编码结果;根据所述第一编码结果和所述第二编码结果,得到所述翻译结果。可选的,所述翻译模块,还配置为:对所述第一编码结果和所述第二编码结果进行融合处理,得到目标编码结果;根据所述目标编码结果,得到所述翻译结果。可选的,所述翻译模块,还配置为:根据所述目标编码结果,得到所述文本信息中每个词语的句子级别上下文;根据所述句子级别上下文,得到所述文本信息中每个词语的篇章级别上下文;通过插值方式将所述句子级别上下文、所述篇章级别上下文与所述文本信息进行融合,得到融合结果;将所述融合结果输入所述翻译模型的解码器,得到所述翻译结果。可选的,所述装置还包括:训练模块,配置为基于预设训练语料,对所述翻译模型进行训练,得到目标翻译模型;所述翻译模块,还配置为:将所述篇章结构信息和所述待翻译篇章的文本信息输入所述目标翻译模型,得到所述翻译结果。根据本公开实施例的第三方面,提供一种机器翻译装置,包括:处理器;配置为存储处理器可执行指令的存储器;其中,所述处理器配置为:执行时实现上述任一种机器翻译方法中的步骤。根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由机器翻译装置的处理器执行时,使得所述装置能够执行上述任一种机器翻译方法。本公开的实施例提供的技术方案可以包括以下有益效果:由上述实施例可知,本公开可以将篇章结构信息和待翻译篇章的文本信息输入翻译模型,以得到翻译结果。由于篇章结构信息能够指示待翻译篇章的篇章结构,通过融合篇章结构信息的翻译模型对待翻译篇章进行翻译,这样,不仅能够对待翻译篇章中的各个句子进行翻译,还能将待翻译篇章的行文逻辑融合至翻译结果中,以得到在整个篇章结构对应语境下的多义字词和/或语句的具体含义,能够提高翻译结果的精确性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种机器翻译方法的流程示意图。图2是根据一示例性实施例示出的一种网络系统示意图。图3是根据一示例性实施例示出的一种篇章分析树示意图。图4是相关技术中的翻译模型的编码器的结构示意图。图5是根据一示例性实施例示出的一种翻译模型的编码器的结构示意图。图6是根据一示例性实施例示出的一种机器翻译装置框图。图7是根据一示例性实施例示出的一种用于机器翻译装置的框图。图8是根据一示例性实施例示出的另一种用于机器翻译装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。本公开实施例中提供了一种机器翻译方法,图1是根据一示例性实施例示出的一种机器翻译方法的本文档来自技高网...

【技术保护点】
1.一种机器翻译方法,其特征在于,包括:/n获取待翻译篇章的篇章结构信息;其中,所述篇章结构信息,用于指示所述待翻译篇章的篇章结构;/n将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果。/n

【技术特征摘要】
1.一种机器翻译方法,其特征在于,包括:
获取待翻译篇章的篇章结构信息;其中,所述篇章结构信息,用于指示所述待翻译篇章的篇章结构;
将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果。


2.根据权利要求1所述的方法,其特征在于,所述获取待翻译篇章的篇章结构信息,包括:
利用语义分割模型对所述待翻译篇章进行分割处理,得到M个基本篇章单元;其中,每个基本篇章单元包括N个词语;
对所述M个基本篇章单元进行分析,得到篇章分析树;其中,所述篇章分析树用于表征各个基本篇章单元之间的篇章关系;
根据所述篇章分析树中M个所述基本篇章单元所对应的M条篇章路径,确定所述篇章结构信息;其中,M和N均为正整数。


3.根据权利要求1所述的方法,其特征在于,所述将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果,包括:
将所述文本信息输入所述翻译模型的第一类编码器,得到第一编码结果;
将所述篇章结构信息输入所述翻译模型的由所述第一类编码器和全连接网络构成的第二类编码器,得到第二编码结果;
根据所述第一编码结果和所述第二编码结果,得到所述翻译结果。


4.根据权利要求3所述的方法,其特征在于,所述根据所述第一编码结果和所述第二编码结果,得到所述翻译结果,包括:
对所述第一编码结果和所述第二编码结果进行融合处理,得到目标编码结果;
根据所述目标编码结果,得到所述翻译结果。


5.根据权利要求4所述的方法,其特征在于,所述根据所述目标编码结果,得到所述翻译结果,包括:
根据所述目标编码结果,得到所述文本信息中每个词语的句子级别上下文;
根据所述句子级别上下文,得到所述文本信息中每个词语的篇章级别上下文;
通过插值方式将所述句子级别上下文、所述篇章级别上下文与所述文本信息进行融合,得到融合结果;
将所述融合结果输入所述翻译模型的解码器,得到所述翻译结果。


6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
基于预设训练语料,对所述翻译模型进行训练,得到目标翻译模型;
所述将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果,包括:
将所述篇章结构信息和所述待翻译篇章的文本信息输入所述目标翻译模型,得到所述翻译结果。


7.一种机器翻译装置,其特征在于,包括:
获取模块,配置为获取待翻译篇章的篇章结构信息;其中,所述篇章结...

【专利技术属性】
技术研发人员:陈骏轩李响刘凯崔建伟
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1