层次化翻译方法、装置及存储介质制造方法及图纸

技术编号:22219321 阅读:30 留言:0更新日期:2019-09-30 01:26
本发明专利技术实施例提供一种层次化翻译方法、装置及存储介质,该方法包括:确定待翻译对象中的关键信息,关键信息包括中心词和实词中至少一个;根据关键信息和待翻译对象,生成句子模板,句子模板中包含关键信息对应的翻译结果;根据句子模板和待翻译对象,生成待翻译对象对应的翻译结果。本发明专利技术实施例可以保证关键信息的翻译正确率。

Hierarchical translation methods, devices and storage media

【技术实现步骤摘要】
层次化翻译方法、装置及存储介质
本专利技术实施例涉及人工智能技术,尤其涉及一种层次化翻译方法、装置及存储介质。
技术介绍
作为人工智能的目标之一,机器翻译具有重要的科学研究价值。同时,机器翻译又具有重要的实用价值。随着经济全球化及互联网的飞速发展,机器翻译在促进政治、经济、文化交流等方面起到越来越重要的作用。在相关技术中,机器翻译主要采用端到端翻译模型,对需要翻译的内容进行统一处理,生成翻译结果,从而有一定概率造成关键信息的丢失或者翻译错误。但在一些场景中,例如同声传译或者相对正式的内容翻译中,需要保证关键信息的翻译准确率。因此,目前亟需研究一种保证关键信息的翻译正确率的翻译方法。
技术实现思路
本专利技术实施例提供一种层次化翻译方法、装置及存储介质,以保证关键信息的翻译正确率。第一方面,本专利技术实施例提供一种层次化翻译方法,包括:确定待翻译对象中的关键信息,关键信息包括中心词和实词中至少一个;根据关键信息和待翻译对象,生成句子模板,句子模板中包含关键信息对应的翻译结果;根据句子模板和待翻译对象,生成待翻译对象对应的翻译结果。在一种可能的设计中,上述确定待翻译对象中的关键信息,可以包括:使用第一预设模型确定待翻译对象中的关键信息。其中,待翻译对象为第一预设模型的输入,关键信息为第一预设模型的输出。可选地,第一预设模型可以为以下任一模型:RNN模型,CNN模型和Transformer模型等。其中,Transformer模型是一种完全基于Attention机制来加速深度学习训练过程的算法模型。在一种可能的设计中,上述根据关键信息和待翻译对象,生成句子模板,可以包括:使用第二预设模型,根据关键信息和待翻译对象,生成句子模板。其中,关键信息和待翻译对象为第二预设模型的输入,句子模板为第二预设模型的输出。可选地,第二预设模型可以为基于以下任一模型获得的:RNN模型,CNN模型和Transformer模型,等等。在一种可能的设计中,上述根据句子模板和待翻译对象,生成待翻译对象对应的翻译结果,可以包括:使用第三预设模型,根据句子模板和待翻译对象,生成待翻译对象对应的翻译结果。其中,句子模板和待翻译对象为第三预设模型的输入,待翻译对象对应的翻译结果为第三预设模型的输出。可选地,第三预设模型可以为基于以下任一模型获得的:RNN模型,CNN模型和Transformer模型,等等。可选地,第一预设模型和第二预设模型的softmax层采用GumbelSoftmax采样技术确定参数。第二方面,本专利技术实施例提供一种层次化翻译装置,包括:第一处理模块,用于确定待翻译对象中的关键信息,关键信息包括中心词和实词中至少一个;第二处理模块,用于根据关键信息和待翻译对象,生成句子模板,句子模板中包含关键信息对应的翻译结果;第三处理模块,用于根据句子模板和待翻译对象,生成待翻译对象对应的翻译结果。在一种可能的设计中,上述第一处理模块可以具体用于:使用第一预设模型确定待翻译对象中的关键信息。其中,待翻译对象为第一预设模型的输入,关键信息为第一预设模型的输出。可选地,第一预设模型可以为以下任一模型:RNN模型,CNN模型和Transformer模型等。其中,Transformer模型是一种完全基于Attention机制来加速深度学习训练过程的算法模型。在一种可能的设计中,上述第二处理模块可以具体用于:使用第二预设模型,根据关键信息和待翻译对象,生成句子模板。其中,关键信息和待翻译对象为第二预设模型的输入,句子模板为第二预设模型的输出。可选地,第二预设模型可以为基于以下任一模型获得的:RNN模型,CNN模型和Transformer模型,等等。在一种可能的设计中,上述第三处理模块可以具体用于:使用第三预设模型,根据句子模板和待翻译对象,生成待翻译对象对应的翻译结果。其中,句子模板和待翻译对象为第三预设模型的输入,待翻译对象对应的翻译结果为第三预设模型的输出。可选地,第三预设模型可以为基于以下任一模型获得的:RNN模型,CNN模型和Transformer模型,等等。可选地,第一预设模型和第二预设模型的softmax层采用GumbelSoftmax采样技术确定参数。第三方面,本专利技术实施例提供一种层次化翻译装置,包括:至少一个处理器和存储器。其中,存储器存储计算机执行指令;至少一个处理器执行该存储器存储的计算机执行指令,使得至少一个处理器执行如第一方面任一项所述的方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面任一项所述的方法。本专利技术实施例提供的层次化翻译方法、装置及存储介质,首先确定待翻译对象中的关键信息,并根据关键信息和待翻译对象,生成句子模板,该句子模板中包含关键信息对应的翻译结果,即首先翻译待翻译对象中的关键信息,之后根据句子模板和待翻译对象,生成待翻译对象对应的翻译结果,在已翻译的关键信息的基础上再翻译其他的上下文内容。通过上述层次化翻译,优先保证关键信息的翻译正确率,提升用户体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的层次化翻译方法的流程图;图2为本专利技术一实施例提供的第二预设模型的示例图;图3为本专利技术一实施例提供的第三预设模型的示例图;图4为本专利技术一实施例提供的层次化翻译模型的示意图;图5为本专利技术一实施例提供的层次化翻译装置的结构示意图;图6为本专利技术另一实施例提供的层次化翻译装置的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。本专利技术实施例的应用场景可以包括但不限于语音翻译和文本翻译。图1为本专利技术一实施例提供的层次化翻译方法的流程图。本专利技术实施例提供一种层次化翻译方法,该层次化翻译方法可以由翻译软件/客户端所安装的层次化翻译装置的处理设备,例如处理器,执行相应的软件代码实现,也可由该层次化翻译装置的处理设备执行相应的软件代码,并结合其他硬件实体实现。其中,层次化翻译装置例如是台式电脑、笔记本、个人数字助理(personaldigitalassistant,简称:PDA)、智能手机、平板电脑和翻译机等终端设备,也可以是服务器。该实施例以终端设备为执行主体进行说明。服务器的执行方式类似,本实施例此处不做赘述。终端设备的处理器上可通过执行软件应用并在终端设备的显示设备上渲染生成翻译界面。如图1所示,该层次化翻译方法包括:S101、确定待翻译对象中的关键信息。其中,关键信息包括中心词和实词中至少一个。可以理解,待翻译对象通常是一个句子,而句子的成分由词或词组充当。例如,在现代汉语中,一般的句子成分有八种,即主语、谓语、宾语、动语,定语、状语,补语和中心语;在英语中,句子成分包括主语、谓语、宾语、表语、定语、状语、补足语和同位语。一个句子中,不同的词或词组所发本文档来自技高网...

【技术保护点】
1.一种层次化翻译方法,其特征在于,包括:确定待翻译对象中的关键信息,所述关键信息包括中心词和实词中至少一个;根据所述关键信息和所述待翻译对象,生成句子模板,所述句子模板中包含所述关键信息对应的翻译结果;根据所述句子模板和所述待翻译对象,生成所述待翻译对象对应的翻译结果。

【技术特征摘要】
1.一种层次化翻译方法,其特征在于,包括:确定待翻译对象中的关键信息,所述关键信息包括中心词和实词中至少一个;根据所述关键信息和所述待翻译对象,生成句子模板,所述句子模板中包含所述关键信息对应的翻译结果;根据所述句子模板和所述待翻译对象,生成所述待翻译对象对应的翻译结果。2.根据权利要求1所述的方法,其特征在于,所述确定待翻译对象中的关键信息,包括:使用第一预设模型确定所述待翻译对象中的所述关键信息,其中,所述待翻译对象为所述第一预设模型的输入,所述关键信息为所述第一预设模型的输出。3.根据权利要求2所述的方法,其特征在于,所述第一预设模型为以下任一模型:循环神经网络RNN模型,卷积神经网络CNN模型,Transformer模型。4.根据权利要求1所述的方法,其特征在于,所述根据所述关键信息和所述待翻译对象,生成句子模板,包括:使用第二预设模型根据所述关键信息和所述待翻译对象,生成所述句子模板,其中,所述关键信息和所述待翻译对象为所述第二预设模型的输入,所述句子模板为所述第二预设模型的输出。5.根据权利要求4所述的方法,其特征在于,所述第二预设模型为基于以下任一模型获得的:循环神经网络RNN模型,卷积神经网络CNN模型,Transformer模型。6.根据权利要求1所述的方法,其特征在于,所述根据所述句子模板和所述待翻译对象,生成所述待翻译对象对应的翻译结果,包括:使用第...

【专利技术属性】
技术研发人员:熊皓张睿卿何中军李芝吴华王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1