翻译方法及装置、计算机可读存储介质和电子设备制造方法及图纸

技术编号:32850071 阅读:58 留言:0更新日期:2022-03-30 19:03
本发明专利技术提供了一种翻译方法及装置、计算机可读存储介质和电子设备,涉及数据处理技术领域。该翻译方法包括:获取源语言的待翻译信息对应的文本识别信息,其中,文本识别信息包括混淆网络;将文本识别信息输入翻译模型,以生成待翻译信息对应的目标语言的翻译结果。由于包括混淆网络的文本识别信息能够有效丰富待翻译信息的文本识别结果,因此,本发明专利技术提供的翻译方法能够提高翻译精准度。翻译方法能够提高翻译精准度。翻译方法能够提高翻译精准度。

【技术实现步骤摘要】
翻译方法及装置、计算机可读存储介质和电子设备


[0001]本专利技术涉及数据处理
,具体涉及翻译方法及装置、计算机可读存储介质和电子设备。

技术介绍

[0002]近年来,随着全球化的加速发展,越来越多的翻译需求日益涌现。相应地,翻译技术也日益受到关注,尤其是将一个语种(源语言)的语音翻译成另一个语种(目标语言)的文本或者语音的语音翻译技术。
[0003]然而,现有翻译技术的翻译准确度和鲁棒性均较差。即使是基于神经网络的翻译技术,由于受限于训练数据和模型结构的影响,其翻译效果仍然不够理想。

技术实现思路

[0004]为了解决上述技术问题,提出了本专利技术。本专利技术的实施例提供了一种翻译方法及装置、计算机可读存储介质和电子设备。
[0005]第一方面,本专利技术一实施例提供一种翻译方法,该方法包括:获取源语言的待翻译信息对应的文本识别信息,其中,文本识别信息包括混淆网络;将文本识别信息输入翻译模型,以生成待翻译信息对应的目标语言的翻译结果。
[0006]在本专利技术一实施例中,文本识别信息包括多个候选文本识别结果及其各自对应的权重信息,其中,多个候选文本识别结果对应于混淆网络上的多条候选路径。
[0007]在本专利技术一实施例中,多个候选文本识别结果中的每个候选文本识别结果包括多个候选文本识别单元,权重信息包括多个候选文本识别单元各自对应的概率信息。
[0008]在本专利技术一实施例中,翻译模型是经过混淆网络训练得到的。
[0009]在本专利技术一实施例中,当待翻译信息为待翻译语音信息时,在将文本识别信息输入翻译模型,以生成待翻译信息对应的目标语言的翻译结果之前,该方法还包括:基于待翻译语音信息提取声学特征信息。其中,将文本识别信息输入翻译模型,以生成待翻译信息对应的目标语言的翻译结果,包括:将文本识别信息和声学特征信息输入翻译模型,以生成待翻译信息对应的目标语言的翻译结果。
[0010]在本专利技术一实施例中,在基于混淆网络训练得到翻译模型之前,该方法还包括:基于混淆网络中的候选文本识别单元生成文本嵌入信息;基于混淆网络中的候选路径生成基于词格的位置嵌入信息;基于文本嵌入信息、基于词格的位置嵌入信息和混淆网络中的候选文本识别单元对应的概率信息构建并训练翻译模型。
[0011]第二方面,本专利技术一实施例提供一种翻译装置,该装置包括:获取模块,用于获取源语言的待翻译信息对应的文本识别信息,其中,文本识别信息包括混淆网络;翻译模块,用于将文本识别信息输入翻译模型,以生成待翻译信息对应的目标语言的翻译结果。
[0012]在本专利技术一实施例中,当待翻译信息为待翻译语音信息时,翻译装置还包括语音合成模块,用于将目标语言的翻译结果合成目标语言的语音信息。
[0013]第三方面,本专利技术一实施例提供一种计算机可读存储介质,所述存储介质存储有指令,当所述指令由电子设备的处理器执行时,使得所述电子设备能够执行上述任一实施例所提及的翻译方法。
[0014]第四方面,本专利技术一实施例提供一种电子设备,所述电子设备包括:处理器和用于存储所述计算机可执行指令的存储器。所述处理器,用于执行所述计算机可执行指令,以实现上述任一实施例所提及的翻译方法。
[0015]由于包括混淆网络的文本识别信息能够有效丰富待翻译信息的文本识别结果,因此,与现有技术相比,本专利技术实施例提供的翻译方法能够利用翻译模型实现提高翻译精准度的目的。
附图说明
[0016]图1所示为本专利技术一实施例提供的翻译方法的应用场景示意图。
[0017]图2所示为本专利技术一实施例提供的翻译方法的流程示意图。
[0018]图3所示为本专利技术另一实施例提供的翻译方法的流程示意图。
[0019]图4所示为本专利技术一实施例提供的翻译方法的实际应用示意图。
[0020]图5所示为本专利技术又一实施例提供的翻译方法的流程示意图。
[0021]图6所示为本专利技术一实施例提供的网络模型的训练方法的流程示意图。
[0022]图7所示为本专利技术另一实施例提供的网络模型的训练方法的流程示意图。
[0023]图8所示为本专利技术又一实施例提供的网络模型的训练方法的流程示意图。
[0024]图9所示为本专利技术再一实施例提供的网络模型的训练方法的流程示意图。
[0025]图10所示为本专利技术一实施例提供的翻译神经网络的结构示意图。
[0026]图11所示为本专利技术一实施例提供的翻译装置的结构示意图。
[0027]图12所示为本专利技术一实施例提供的网络模型的训练装置的结构示意图。
[0028]图13所示为本专利技术一实施例提供的用于翻译方法的装置的结构示意图。
[0029]图14所示为本专利技术一实施例提供的服务器的结构示意图。
具体实施方式
[0030]下面,将参考附图详细地描述根据本专利技术的示例实施例。显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是本专利技术的全部实施例,应理解,本专利技术不受这里描述的示例实施例的限制。
[0031]本专利技术提供的技术方案可以应用在智能终端(比如平板电脑、手机等)中,以使智能终端具备翻译功能。示例性地,本专利技术提供的技术方案可应用于单一目标语言的翻译场景,比如,同声传译、音视频字幕制作和语音输入法翻译等场景。此外,本专利技术提供的技术方案亦可应用于多目标语言的翻译场景,比如,需要基于源语言的音频信息生成多个目标语言的音频信息的虚拟主播场景。
[0032]下面结合图1对翻译方法的应用场景进行简单的介绍。
[0033]图1所示为本专利技术一实施例提供的翻译方法的应用场景示意图。图1所示的场景包括服务器110以及与服务器110通信连接的客户端120。具体而言,服务器110中可以装载基于本专利技术实施例提及的网络模型的训练方法训练生成的、支持翻译任务的翻译模型。
[0034]在实际应用过程中,客户端120可以接收用户发出的语音信息(即源语言的待翻译信息),并将接收的语音信息发送至服务器110,服务器110利用装载的支持翻译任务的翻译模型计算与所接收的语音信息对应的目标语言的翻译结果,并将计算得到的目标语言的翻译结果发送至客户端120,客户端120将接收的目标语言的翻译结果呈现给用户。
[0035]示例性地,上述提及的翻译模型为基于深度学习的神经网络模型。
[0036]下面结合图2至图5对本专利技术的翻译方法进行简单的介绍。
[0037]图2所示为本专利技术一实施例提供的翻译方法的流程示意图。如图2所示,本专利技术实施例提供的翻译方法包括如下步骤。
[0038]步骤210,获取源语言的待翻译信息对应的文本识别信息。
[0039]示例性地,文本识别信息为对待翻译信息进行识别后得到的文本信息。比如,待翻译信息为语音信息,文本识别信息为对语音信息进行识别后得到的文本信息。又比如,待翻译信息为包括文本的图片信息,识别信息为对包括文本的图片信息进行识别后得到的文本信息。
[0040]在本专利技术一实施例中,文本识别信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种翻译方法,其特征在于,包括:获取源语言的待翻译信息对应的文本识别信息,其中,所述文本识别信息包括混淆网络;将所述文本识别信息输入翻译模型,以生成所述待翻译信息对应的目标语言的翻译结果。2.根据权利要求1所述的翻译方法,其特征在于,所述文本识别信息包括:多个候选文本识别结果及其各自对应的权重信息,其中,所述多个候选文本识别结果对应于所述混淆网络上的多条候选路径。3.根据权利要求2所述的翻译方法,其特征在于,所述多个候选文本识别结果中的每个候选文本识别结果包括多个候选文本识别单元,所述权重信息包括所述多个候选文本识别单元各自对应的概率信息。4.根据权利要求1所述的翻译方法,其特征在于,所述翻译模型是经过混淆网络训练得到的。5.根据权利要求1至4任一项所述的翻译方法,其特征在于,当所述待翻译信息为待翻译语音信息时,在所述将所述文本识别信息输入翻译模型,以生成所述待翻译信息对应的目标语言的翻译结果之前,还包括:基于所述待翻译语音信息提取声学特征信息;其中,所述将所述文本识别信息输入翻译模型,以生成所述待翻译信息对应的目标语言的翻译结果,包括:将所述文本识别信息和所述声学特征信息输入所述翻译模型,以生成所述待翻译信息对应的目标语言的翻译结果。6.根据权利要...

【专利技术属性】
技术研发人员:卫林钰张旭陈伟
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1