一种语音翻译方法及装置制造方法及图纸

技术编号:21550154 阅读:30 留言:0更新日期:2019-07-06 22:49
本申请公开了一种语音翻译方法及装置,该方法包括:在获取到待翻译的目标语音后,将目标语音的识别文本和目标语音本身这二者共同作为翻译对象进行翻译,以得到目标语音的最终翻译文本,相比于现有技术中先对目标语音进行识别,得到识别文本,再将该识别文本作为翻译对象进行翻译的方式,本申请中的翻译对象更为丰富,即包括识别文本和目标语音两个翻译对象,故而,通过对这两个翻译对象进行翻译的方式,可以确定出更准确的目标语音的翻译文本。

A Speech Translation Method and Device

【技术实现步骤摘要】
一种语音翻译方法及装置
本申请涉及语音翻译
,尤其涉及一种语音翻译方法及装置。
技术介绍
现有的语音翻译方法通常包括两个步骤,即,语音识别和文本翻译。具体地,首先,将一段语音经过语音识别技术,识别成与之同一语种的文本,然后,利用文本翻译技术将该识别文本翻译成另一语种的文本,从而实现语音翻译过程。但是,联合语音识别技术和文本翻译技术进行语音翻译,存在错误累积的缺点,例如,假设采用语音识别技术将某一个单词识别错误,而当采用文本翻译技术对该单词进行翻译时,将根据该错误的单词得到错误的翻译结果。可见,语音识别阶段的错误会累积到文本翻译阶段,从而导致翻译结果的不准确。
技术实现思路
本申请实施例的主要目的在于提供一种语音翻译方法及装置,能够提升语音翻译结果的准确性。本申请实施例提供了一种语音翻译方法,包括:获取待翻译的目标语音;对第一翻译对象和第二翻译对象进行翻译,得到所述目标语音的最终翻译文本,所述第一翻译对象为所述目标语音的识别文本,所述第二翻译对象为所述目标语音。可选的,所述对第一翻译对象和第二翻译对象进行翻译,得到所述目标语音的最终翻译文本,包括:生成所述最终翻译文本中第k个词对应的第一概率分布和第二概率分布;其中,所述第一概率分布包括对所述目标语音的识别文本进行解码后得到的第k个词为词表中每一待选词时的第一解码概率,所述第二概率分布包括对所述目标语音进行解码后得到的第k个词为词表中每一待选词时的第二解码概率;根据所述第一概率分布和所述第二概率分布,得到第k个词的翻译结果。可选的,所述根据所述第一概率分布和所述第二概率分布,得到第k个词的翻译结果,包括:在所述第一概率分布和所述第二概率分布中,将相同待选词对应的第一解码概率和第二解码概率进行融合,得到所述最终翻译文本中第k个词为各个待选词时对应的融合解码概率;选择最大融合解码概率对应的待选词,作为第k个词的翻译结果。可选的,所述对第一翻译对象和第二翻译对象进行翻译,得到所述目标语音的最终翻译文本,包括:对所述目标语音的识别文本进行翻译,得到第一翻译文本;对所述目标语音进行直接翻译,得到第二翻译文本;根据所述第一翻译文本和所述第二翻译文本,得到所述目标语音的最终翻译文本。可选的,所述根据所述第一翻译文本和所述第二翻译文本,得到所述目标语音的最终翻译文本,包括:确定所述第一翻译文本作为所述目标语音的最终翻译文本时的置信度;确定所述第二翻译文本作为所述目标语音的最终翻译文本时的置信度;选择较大置信度对应的翻译文本,作为所述目标语音的最终翻译文本。可选的,所述确定所述第一翻译文本作为所述目标语音的最终翻译文本时的置信度,包括:获取所述第一翻译文本的各个文本单元各自对应的解码概率,所述解码概率表征对应文本单元属于翻译结果的可能性大小;根据所述第一翻译文本的各个文本单元各自对应的解码概率,确定所述第一翻译文本作为所述目标语音的最终翻译文本时的置信度。可选的,所述确定所述第二翻译文本作为所述目标语音的最终翻译文本时的置信度,包括:获取所述第二翻译文本的各个文本单元各自对应的解码概率,所述解码概率表征对应文本单元属于翻译结果的可能性大小;根据所述第二翻译文本的各个文本单元各自对应的解码概率,确定所述第二翻译文本作为所述目标语音的最终翻译文本时的置信度。可选的,所述对第一翻译对象和第二翻译对象进行翻译,包括:利用预先构建的语音识别模型,对所述目标语音进行识别,得到识别文本;利用预先构建的文本翻译模型,对所述识别文本进行翻译;利用预先构建的语音翻译模型,对所述目标语音进行翻译;其中,所述语音翻译模型与所述语音识别模型共享或不共享部分模型参数。本申请实施例还提供了一种语音翻译装置,包括:目标语音获取单元,用于获取待翻译的目标语音;翻译文本获得单元,用于对第一翻译对象和第二翻译对象进行翻译,得到所述目标语音的最终翻译文本,所述第一翻译对象为所述目标语音的识别文本,所述第二翻译对象为所述目标语音。可选的,所述翻译文本获得单元包括:概率分布生成子单元,用于生成所述最终翻译文本中第k个词对应的第一概率分布和第二概率分布;其中,所述第一概率分布包括对所述目标语音的识别文本进行解码后得到的第k个词为词表中每一待选词时的第一解码概率,所述第二概率分布包括对所述目标语音进行解码后得到的第k个词为词表中每一待选词时的第二解码概率;翻译结果获得子单元,用于根据所述第一概率分布和所述第二概率分布,得到第k个词的翻译结果。可选的,所述翻译结果获得子单元包括:融合解码概率获得子单元,用于在所述第一概率分布和所述第二概率分布中,将相同待选词对应的第一解码概率和第二解码概率进行融合,得到所述最终翻译文本中第k个词为各个待选词时对应的融合解码概率;第一翻译结果获得子单元,用于选择最大融合解码概率对应的待选词,作为第k个词的翻译结果。可选的,所述翻译文本获得单元包括:第一翻译文本获得子单元,用于对所述目标语音的识别文本进行翻译,得到第一翻译文本;第二翻译文本获得子单元,用于对所述目标语音进行直接翻译,得到第二翻译文本;最终翻译文本获得子单元,用于根据所述第一翻译文本和所述第二翻译文本,得到所述目标语音的最终翻译文本。可选的,所述最终翻译文本获得子单元包括:第一置信度确定子单元,用于确定所述第一翻译文本作为所述目标语音的最终翻译文本时的置信度;第二置信度确定子单元,用于确定所述第二翻译文本作为所述目标语音的最终翻译文本时的置信度;第二翻译结果获得子单元,用于选择较大置信度对应的翻译文本,作为所述目标语音的最终翻译文本。可选的,所述第一置信度确定子单元包括:第一解码概率获取子单元,用于获取所述第一翻译文本的各个文本单元各自对应的解码概率,所述解码概率表征对应文本单元属于翻译结果的可能性大小;第一置信度获得子单元,用于根据所述第一翻译文本的各个文本单元各自对应的解码概率,确定所述第一翻译文本作为所述目标语音的最终翻译文本时的置信度。可选的,所述第二置信度确定子单元包括:第二解码概率获取子单元,用于获取所述第二翻译文本的各个文本单元各自对应的解码概率,所述解码概率表征对应文本单元属于翻译结果的可能性大小;第二置信度获得子单元,用于根据所述第二翻译文本的各个文本单元各自对应的解码概率,确定所述第二翻译文本作为所述目标语音的最终翻译文本时的置信度。可选的,所述翻译文本获得单元包括:文本识别子单元,用于利用预先构建的语音识别模型,对所述目标语音进行识别,得到识别文本;文本翻译子单元,用于利用预先构建的文本翻译模型,对所述识别文本进行翻译;语音翻译子单元,用于利用预先构建的语音翻译模型,对所述目标语音进行翻译;其中,所述语音翻译模型与所述语音识别模型共享或不共享部分模型参数。本申请实施例还提供了一种语音翻译设备,包括:处理器、存储器、系统总线;所述处理器以及所述存储器通过所述系统总线相连;所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述语音翻译方法中的任意一种实现方式。本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述语音翻译方法中的任意一种实现方式。本申请实施例还本文档来自技高网...

【技术保护点】
1.一种语音翻译方法,其特征在于,包括:获取待翻译的目标语音;对第一翻译对象和第二翻译对象进行翻译,得到所述目标语音的最终翻译文本,所述第一翻译对象为所述目标语音的识别文本,所述第二翻译对象为所述目标语音。

【技术特征摘要】
1.一种语音翻译方法,其特征在于,包括:获取待翻译的目标语音;对第一翻译对象和第二翻译对象进行翻译,得到所述目标语音的最终翻译文本,所述第一翻译对象为所述目标语音的识别文本,所述第二翻译对象为所述目标语音。2.根据权利要求1所述的方法,其特征在于,所述对第一翻译对象和第二翻译对象进行翻译,得到所述目标语音的最终翻译文本,包括:生成所述最终翻译文本中第k个词对应的第一概率分布和第二概率分布;其中,所述第一概率分布包括对所述目标语音的识别文本进行解码后得到的第k个词为词表中每一待选词时的第一解码概率,所述第二概率分布包括对所述目标语音进行解码后得到的第k个词为词表中每一待选词时的第二解码概率;根据所述第一概率分布和所述第二概率分布,得到第k个词的翻译结果。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一概率分布和所述第二概率分布,得到第k个词的翻译结果,包括:在所述第一概率分布和所述第二概率分布中,将相同待选词对应的第一解码概率和第二解码概率进行融合,得到所述最终翻译文本中第k个词为各个待选词时对应的融合解码概率;选择最大融合解码概率对应的待选词,作为第k个词的翻译结果。4.根据权利要求1所述的方法,其特征在于,所述对第一翻译对象和第二翻译对象进行翻译,得到所述目标语音的最终翻译文本,包括:对所述目标语音的识别文本进行翻译,得到第一翻译文本;对所述目标语音进行直接翻译,得到第二翻译文本;根据所述第一翻译文本和所述第二翻译文本,得到所述目标语音的最终翻译文本。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一翻译文本和所述第二翻译文本,得到所述目标语音的最终翻译文本,包括:确定所述第一翻译文本作为所述目标语音的最终翻译文本时的置信度;确定所述第二翻译文本作为所述目标语音的最终翻译文本时的置信度;选择较大置信度对应的翻译文本,作为所述目标语音的最终翻译文本。6.根据权利要求5所述的方法,其特征在于,所述确定所述第一翻译文本作为所述目标语音的最终翻译文本时的置信度,包括:获取所述第一翻译文本的各个文本单元各自对应的解码概率,所述解码概率表征对应文本单元属于翻译结果的可能性大小;根据所述第一翻译文本的各个文本单元各自对应的解码概率,确定所述第一翻译文本作为所述目标语音的最终翻译文本时...

【专利技术属性】
技术研发人员:马志强刘俊华魏思胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1