同声传译处理方法、装置及设备制造方法及图纸

技术编号:22058711 阅读:20 留言:0更新日期:2019-09-07 16:34
本发明专利技术提出了一种同声传译处理方法、装置及设备,其中,方法包括:获取第一语种的语音识别结果,并对语音识别结果进行切词处理,生成切词结果;依次接收切词结果,当接收到的切词结果的个数等于预设值K时,将接收到的切词结果输入到预先训练的从第一语种文本到第二语种文本的翻译模型中进行处理,解码出第一个翻译结果,其中,K为正整数;接收第P个切词结果,将第P个切词结果输入到翻译模型中进行处理,解码出第P‑K+1个翻译结果,其中,P大于K且P为整数。由此,降低了同声传译的翻译延时,将延时控制在词级别。

Simultaneous Interpretation Processing, Devices and Equipment

【技术实现步骤摘要】
同声传译处理方法、装置及设备
本专利技术涉及人工智能
,尤其涉及一种同声传译处理方法、装置及设备。
技术介绍
目前,同声传译在各种会议、传媒活动、广播授课等领域被广泛使用。同声传译是对语音识别技术和机器翻译技术的一大挑战,评价同声传译的效果需要综合考量翻译的延时和准确率。相关技术中的同声传译系统,通常基于对语音识别结果的断句和加标点结果调用翻译,导致翻译结果比语音识别要延时一到多个子句,延时较高。
技术实现思路
为此,本专利技术的第一个目的在于提出一种同声传译处理方法,通过对语音识别结果进行切词,并控制延时K个词翻译,解决了相关技术中同声传译翻译延时较高的问题,降低了同声传译的翻译延时,将延时控制在词级别。本专利技术的第二个目的在于提出一种同声传译处理装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种计算机可读存储介质。本专利技术第一方面实施例提出了一种同声传译处理方法,包括:获取第一语种的语音识别结果,并对所述语音识别结果进行切词处理,生成切词结果;依次接收所述切词结果,当接收到的所述切词结果的个数等于预设值K时,将所述接收到的所述切词结果输入到预先训练的从所述第一语种文本到第二语种文本的翻译模型中进行处理,解码出第一个翻译结果,其中,K为正整数;接收第P个切词结果,将所述第P个切词结果输入到所述翻译模型中进行处理,解码出第P-K+1个翻译结果,其中,P大于K且P为整数。本专利技术实施例的同声传译处理方法,通过获取第一语种的语音识别结果,并对语音识别结果进行切词处理,生成切词结果。进而,依次接收切词结果,当接收到的切词结果的个数等于预设值K时,将接收到的切词结果输入到预先训练的从第一语种文本到第二语种文本的翻译模型中进行处理,解码出第一个翻译结果。进一步,接收第P个切词结果,将第P个切词结果输入到翻译模型中进行处理,解码出第P-K+1个翻译结果。由此,通过在接收到K个词时开始翻译,之后每接收到一个词进行一次翻译,降低了同声传译的翻译延时,将延时控制在词级别,并且可以通过调整参数K来调节延时,更加灵活。另外,根据本专利技术上述实施例的同声传译处理方法还可以具有如下附加技术特征:可选地,在接收第P个切词结果之后,还包括:判断所述第P个切词结果是否为标点;若是,则根据所述翻译模型对所述切词结果进行处理,连续解码出翻译结果直至目标子句翻译结束。可选地,在将所述接收到的所述切词结果输入到预先训练的从所述第一语种文本到第二语种文本的翻译模型中进行处理之前,还包括:获取第一语种的文本语料和对应的第二语种的文本语料作为训练集;根据所述训练集训练预设模型的处理参数,生成所述翻译模型。可选地,在所述翻译模型的编码器端生成隐层向量表示时,根据当前输入词语与之前输入词语进行意图计算。可选地,在连续解码出翻译结果直至目标子句翻译结束之后,还包括:获取当前待翻译子句的第一语音识别结果,确定与所述第一语音识别结果对应的所述目标子句的第二语音识别结果,以及与所述第二语音识别结果对应的目标翻译结果;将所述第一语音识别结果和所述第二语音识别结果合并,获取合并后的语音识别结果;根据所述合并后的语音识别结果和所述目标翻译结果,获取所述第一语音识别结果对应的翻译结果。本专利技术第二方面实施例提出了一种同声传译处理装置,包括:切词模块,用于获取第一语种的语音识别结果,并对所述语音识别结果进行切词处理,生成切词结果;第一处理模块,用于依次接收所述切词结果,当接收到的所述切词结果的个数等于预设值K时,将所述接收到的所述切词结果输入到预先训练的从所述第一语种文本到第二语种文本的翻译模型中进行处理,解码出第一个翻译结果,其中,K为正整数;第二处理模块,用于接收第P个切词结果,将所述第P个切词结果输入到所述翻译模型中进行处理,解码出第P-K+1个翻译结果,其中,P大于K且P为整数。本专利技术实施例的同声传译处理装置,通过获取第一语种的语音识别结果,并对语音识别结果进行切词处理,生成切词结果。进而,依次接收切词结果,当接收到的切词结果的个数等于预设值K时,将接收到的切词结果输入到预先训练的从第一语种文本到第二语种文本的翻译模型中进行处理,解码出第一个翻译结果。进一步,接收第P个切词结果,将第P个切词结果输入到翻译模型中进行处理,解码出第P-K+1个翻译结果。由此,通过在接收到K个词时开始翻译,之后每接收到一个词进行一次翻译,降低了同声传译的翻译延时,将延时控制在词级别,并且可以通过调整参数K来调节延时,更加灵活。另外,根据本专利技术上述实施例的同声传译处理装置还可以具有如下附加技术特征:可选地,所述的装置还包括:判断模块,用于判断所述第P个切词结果是否为标点;若是,则根据所述翻译模型对所述切词结果进行处理,连续解码出翻译结果直至目标子句翻译结束。可选地,所述的装置还包括:训练模块,用于获取第一语种的文本语料和对应的第二语种的文本语料作为训练集;根据所述训练集训练预设模型的处理参数,生成所述翻译模型。可选地,在所述翻译模型的编码器端生成隐层向量表示时,根据当前输入词语与之前输入词语进行意图计算。可选地,所述的装置还包括:第三处理模块,用于获取当前待翻译子句的第一语音识别结果,确定与所述第一语音识别结果对应的所述目标子句的第二语音识别结果,以及与所述第二语音识别结果对应的目标翻译结果;将所述第一语音识别结果和所述第二语音识别结果合并,获取合并后的语音识别结果;根据所述合并后的语音识别结果和所述目标翻译结果,获取所述第一语音识别结果对应的翻译结果。本专利技术第三方面实施例提出了一种计算机设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的同声传译处理方法。本专利技术第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的同声传译处理方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明图1为本专利技术实施例所提供的一种同声传译处理方法的流程示意图;图2为本专利技术实施例所提供的另一种同声传译处理方法的流程示意图;图3为本专利技术实施例所提供的一种翻译原理示意图;图4为本专利技术实施例所提供的一种同声传译处理装置的结构示意图;图5为本专利技术实施例所提供的另一种同声传译处理装置的结构示意图;图6示出了适于用来实现本专利技术实施例的示例性计算机设备的框图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的同声传译处理方法、装置及设备。图1为本专利技术实施例所提供的一种同声传译处理方法的流程示意图,如图1所示,该方法包括:步骤101,获取第一语种的语音识别结果,并对语音识别结果进行切词处理,生成切词结果。本专利技术实施例中,在进行同声传译时,可以先获取语音识别的结果。例如,对第一语种的语音进行同声传译,以翻译成其他语种的文本时,可以先接收第一语种的语音信号,并对第一语种的本文档来自技高网...

【技术保护点】
1.一种同声传译处理方法,其特征在于,包括:获取第一语种的语音识别结果,并对所述语音识别结果进行切词处理,生成切词结果;依次接收所述切词结果,当接收到的所述切词结果的个数等于预设值K时,将所述接收到的所述切词结果输入到预先训练的从所述第一语种文本到第二语种文本的翻译模型中进行处理,解码出第一个翻译结果,其中,K为正整数;接收第P个切词结果,将所述第P个切词结果输入到所述翻译模型中进行处理,解码出第P‑K+1个翻译结果,其中,P大于K且P为整数。

【技术特征摘要】
1.一种同声传译处理方法,其特征在于,包括:获取第一语种的语音识别结果,并对所述语音识别结果进行切词处理,生成切词结果;依次接收所述切词结果,当接收到的所述切词结果的个数等于预设值K时,将所述接收到的所述切词结果输入到预先训练的从所述第一语种文本到第二语种文本的翻译模型中进行处理,解码出第一个翻译结果,其中,K为正整数;接收第P个切词结果,将所述第P个切词结果输入到所述翻译模型中进行处理,解码出第P-K+1个翻译结果,其中,P大于K且P为整数。2.如权利要求1所述的方法,其特征在于,在接收第P个切词结果之后,还包括:判断所述第P个切词结果是否为标点;若是,则根据所述翻译模型对所述切词结果进行处理,连续解码出翻译结果直至目标子句翻译结束。3.如权利要求1所述的方法,其特征在于,在将所述接收到的所述切词结果输入到预先训练的从所述第一语种文本到第二语种文本的翻译模型中进行处理之前,还包括:获取第一语种的文本语料和对应的第二语种的文本语料作为训练集;根据所述训练集训练预设模型的处理参数,生成所述翻译模型。4.如权利要求3所述的方法,其特征在于,在所述翻译模型的编码器端生成隐层向量表示时,根据当前输入词语与之前输入词语进行意图计算。5.如权利要求2所述的方法,其特征在于,在连续解码出翻译结果直至目标子句翻译结束之后,还包括:获取当前待翻译子句的第一语音识别结果,确定与所述第一语音识别结果对应的所述目标子句的第二语音识别结果,以及与所述第二语音识别结果对应的目标翻译结果;将所述第一语音识别结果和所述第二语音识别结果合并,获取合并后的语音识别结果;根据所述合并后的语音识别结果和所述目标翻译结果,获取所述第一语音识别结果对应的翻译结果。6.一种同声传译处理装置,其特征在于,包括:切词模块,用于获取第一语种的语音识别结果,并对所述语音识别结果进行切词处理,生成切词结果...

【专利技术属性】
技术研发人员:张传强毕天驰徐梓翔熊皓何中军李芝
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1