【技术实现步骤摘要】
机器翻译方法、装置及存储介质
本公开涉及机器翻译领域,尤其涉及一种机器翻译方法、装置及存储介质。
技术介绍
在机器翻译领域,因受机器限制,普遍采用单句翻译的方法对待翻译篇章进行翻译,即依次建模待翻译篇章中的每个句子,并对其进行翻译。但是,由于是对待翻译篇章中的每个句子依次建模的,在翻译的过程中,没有考虑各个句子之间的关联性,会导致翻译结果不够精确。
技术实现思路
本公开提供一种机器翻译方法、装置及存储介质。根据本公开实施例的第一方面,提供一种机器翻译方法,包括:获取待翻译篇章的篇章结构信息;其中,所述篇章结构信息,用于指示所述待翻译篇章的篇章结构;将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果。可选的,所述获取待翻译篇章的篇章结构信息,包括:利用语义分割模型对所述待翻译篇章进行分割处理,得到M个基本篇章单元;其中,每个基本篇章单元包括N个词语;对所述M个基本篇章单元进行分析,得到篇章分析树;其中,所述篇章分析树用于表征各个基本篇章单元之间的篇章关系;根据所述篇章分析树中M个所述基本篇章单元所对应的M条篇章路径,确定所述篇章结构信息;其中,M和N均为正整数。可选的,所述将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果,包括:将所述文本信息输入所述翻译模型的第一类编码器,得到第一编码结果;将所述篇章结构信息输入所述翻译模型的由所述第一类编码器和全连接网络构成的第二类编码器,得到 ...
【技术保护点】
1.一种机器翻译方法,其特征在于,包括:/n获取待翻译篇章的篇章结构信息;其中,所述篇章结构信息,用于指示所述待翻译篇章的篇章结构;/n将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果。/n
【技术特征摘要】
1.一种机器翻译方法,其特征在于,包括:
获取待翻译篇章的篇章结构信息;其中,所述篇章结构信息,用于指示所述待翻译篇章的篇章结构;
将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果。
2.根据权利要求1所述的方法,其特征在于,所述获取待翻译篇章的篇章结构信息,包括:
利用语义分割模型对所述待翻译篇章进行分割处理,得到M个基本篇章单元;其中,每个基本篇章单元包括N个词语;
对所述M个基本篇章单元进行分析,得到篇章分析树;其中,所述篇章分析树用于表征各个基本篇章单元之间的篇章关系;
根据所述篇章分析树中M个所述基本篇章单元所对应的M条篇章路径,确定所述篇章结构信息;其中,M和N均为正整数。
3.根据权利要求1所述的方法,其特征在于,所述将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果,包括:
将所述文本信息输入所述翻译模型的第一类编码器,得到第一编码结果;
将所述篇章结构信息输入所述翻译模型的由所述第一类编码器和全连接网络构成的第二类编码器,得到第二编码结果;
根据所述第一编码结果和所述第二编码结果,得到所述翻译结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一编码结果和所述第二编码结果,得到所述翻译结果,包括:
对所述第一编码结果和所述第二编码结果进行融合处理,得到目标编码结果;
根据所述目标编码结果,得到所述翻译结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标编码结果,得到所述翻译结果,包括:
根据所述目标编码结果,得到所述文本信息中每个词语的句子级别上下文;
根据所述句子级别上下文,得到所述文本信息中每个词语的篇章级别上下文;
通过插值方式将所述句子级别上下文、所述篇章级别上下文与所述文本信息进行融合,得到融合结果;
将所述融合结果输入所述翻译模型的解码器,得到所述翻译结果。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
基于预设训练语料,对所述翻译模型进行训练,得到目标翻译模型;
所述将所述篇章结构信息和所述待翻译篇章的文本信息输入翻译模型,得到翻译结果,包括:
将所述篇章结构信息和所述待翻译篇章的文本信息输入所述目标翻译模型,得到所述翻译结果。
7.一种机器翻译装置,其特征在于,包括:
获取模块,配置为获取待翻译篇章的篇章结构信息;其中,所述篇章结...
【专利技术属性】
技术研发人员:陈骏轩,李响,刘凯,崔建伟,
申请(专利权)人:北京小米松果电子有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。