翻译处理方法、装置及设备制造方法及图纸

技术编号:19748232 阅读:20 留言:0更新日期:2018-12-12 05:15
本发明专利技术提出了一种翻译处理方法、装置及设备,其中,方法包括:获取第一语种的第一语音信号,按照预设算法提取第一语音信号的语音特征向量;将语音特征向量输入到预先训练的从第一语种语音到第二语种文本的端到端翻译模型中进行处理,获取与第一语音信号对应的第二语种的文本信息;对第二语种的文本信息进行语音合成,获取对应的第二语音信号并播放。由此,通过端到端翻译模型将第一语种的语音直接转换为第二语种的文本,避免了将语音识别步骤的错误传递给翻译步骤,提高了语音翻译的准确性。

【技术实现步骤摘要】
翻译处理方法、装置及设备
本专利技术涉及语音翻译
,尤其涉及一种翻译处理方法、装置及设备。
技术介绍
目前在语言不通的情况下,用户希望将一种语言转换成另一种语言,实现跨语种沟通。语音翻译常见于出国游玩、不同语种人群间的沟通交流等场景,能够满足用户这方面的需求。相关技术中,通常是对说话者进行语音识别,将语音内容转换成文字后通过翻译引擎翻译成目标语言的文字,最后通过语音合成技术生成目标语言的语音。然而,在语音识别过程中会出现识别不准确的情况,例如说话者要表达的信息是“附近有卖热狗的吗?”,而经过语音识别可能会错误识别成“附近有卖芒果的吗?”,进而将已经识别错误的信息进行翻译,很难实现语义的正确反馈,语音翻译的准确性还有待提高。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种翻译处理方法,通过端到端翻译模型将第一语种的语音直接转换为第二语种的文本,避免了将语音识别步骤的错误传递给翻译步骤,提高了语音翻译的准确性。本专利技术的第二个目的在于提出一种翻译处理装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。为达上述目的,本专利技术第一方面实施例提出了一种翻译处理方法,包括:获取第一语种的第一语音信号,按照预设算法提取所述第一语音信号的语音特征向量;将所述语音特征向量输入到预先训练的从第一语种语音到第二语种文本的端到端翻译模型中进行处理,获取与所述第一语音信号对应的所述第二语种的文本信息;对所述第二语种的文本信息进行语音合成,获取对应的第二语音信号并播放。本专利技术实施例的翻译处理方法,通过获取第一语种的第一语音信号,按照预设算法提取第一语音信号的语音特征向量。进而,将语音特征向量输入到预先训练的从第一语种语音到第二语种文本的端到端翻译模型中进行处理,获取与第一语音信号对应的第二语种的文本信息。进一步对第二语种的文本信息进行语音合成,获取对应的第二语音信号并播放。由此,通过将第一语种的语音信号的语音特征向量输入到端到端翻译模型中,实现了直接将第一语种的语音转换为第二语种的文本信息,避免了将语音识别步骤的错误传递给翻译步骤,提高了语音翻译的准确性。另外,根据本专利技术上述实施例的翻译处理方法还可以具有如下附加技术特征:可选地,所述按照预设算法提取所述第一语音信号的语音特征向量,包括:对所述第一语音信号进行梅尔频率倒谱分析生成第一维度的语音特征向量;根据所述端到端翻译模型的输入信息维度对所述第一维度的语音特征向量进行变换处理,生成与所述输入信息维度匹配的第二维度的语音特征向量。可选地,在将所述语音特征向量输入到预先训练的从第一语种语音到第二语种文本的端到端翻译模型中进行处理之前,还包括:获取所述第一语种的语音语料与对应的所述第二语种的文本语料的翻译训练语料;根据所述翻译训练语料训练预设模型的处理参数,生成所述端到端翻译模型。可选地,若所述第一语种和所述第二语种为小语种翻译,则所述获取所述第一语种的语音语料与对应的所述第二语种的文本语料的翻译训练语料,包括:通过语音识别系统对所述第一语种的语音语料进行识别处理获取所述第一语种的文本语料;通过翻译引擎将所述第一语种的文本语料翻译成所述第二语种的文本语料。可选地,所述获取所述第一语种的语音语料与对应的所述第二语种的文本语料的翻译训练语料,包括:获取经过人工标注的与所述第一语种的语音语料对应的第一语种的文本语料;通过翻译引擎将所述第一语种的文本语料翻译成所述第二语种的文本语料。为达上述目的,本专利技术第二方面实施例提出了一种翻译处理装置,包括:获取模块,用于获取第一语种的第一语音信号,按照预设算法提取所述第一语音信号的语音特征向量;处理模块,用于将所述语音特征向量输入到预先训练的从第一语种语音到第二语种文本的端到端翻译模型中进行处理,获取与所述第一语音信号对应的所述第二语种的文本信息;合成模块,用于对所述第二语种的文本信息进行语音合成,获取对应的第二语音信号并播放。本专利技术实施例的翻译处理装置,通过获取第一语种的第一语音信号,按照预设算法提取第一语音信号的语音特征向量。进而,将语音特征向量输入到预先训练的从第一语种语音到第二语种文本的端到端翻译模型中进行处理,获取与第一语音信号对应的第二语种的文本信息。进一步对第二语种的文本信息进行语音合成,获取对应的第二语音信号并播放。由此,实现了将第一语种的语音直接转换为第二语种的文本,避免了将语音识别步骤的错误传递给翻译步骤,提高了语音翻译的准确性。另外,根据本专利技术上述实施例的翻译处理装置还可以具有如下附加技术特征:可选地,所述获取模块具体用于:对所述第一语音信号进行梅尔频率倒谱分析生成第一维度的语音特征向量;根据所述端到端翻译模型的输入信息维度对所述第一维度的语音特征向量进行变换处理,生成与所述输入信息维度匹配的第二维度的语音特征向量。可选地,所述的装置还包括:训练模块,用于获取所述第一语种的语音语料与对应的所述第二语种的文本语料的翻译训练语料;根据所述翻译训练语料训练预设模型的处理参数,生成所述端到端翻译模型。可选地,若所述第一语种和所述第二语种为小语种翻译,则所述训练模块具体用于:通过语音识别系统对所述第一语种的语音语料进行识别处理获取所述第一语种的文本语料;通过翻译引擎将所述第一语种的文本语料翻译成所述第二语种的文本语料。可选地,所述训练模块具体用于:获取经过人工标注的与所述第一语种的语音语料对应的第一语种的文本语料;通过翻译引擎将所述第一语种的文本语料翻译成所述第二语种的文本语料。为达上述目的,本专利技术第三方面实施例提出了一种计算机设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的翻译处理方法。为达上述目的,本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面实施例所述的翻译处理方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明图1为本专利技术实施例所提供的一种翻译处理方法的流程示意图;图2为本专利技术实施例所提供的另一种翻译处理方法的流程示意图;图3为本专利技术实施例所提供的一种端到端语音翻译模型一层结构示意图;图4为本专利技术实施例所提供的另一种翻译处理方法的流程示意图;图5为本专利技术实施例所提供的一种获取翻译训练语料的示意图;图6为本专利技术实施例所提供的另一种获取翻译训练语料的示意图;图7为本专利技术实施例所提供的一种翻译处理装置的结构示意图;图8为本专利技术实施例所提供的另一种翻译处理装置的结构示意图;图9示出了适于用来实现本专利技术实施例的示例性计算机设备的框图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的翻译处理方法、装置及设备。图1为本专利技术实施例所提供的一种翻译处理方法的流程示意图,如图本文档来自技高网...

【技术保护点】
1.一种翻译处理方法,其特征在于,包括以下步骤:获取第一语种的第一语音信号,按照预设算法提取所述第一语音信号的语音特征向量;将所述语音特征向量输入到预先训练的从第一语种语音到第二语种文本的端到端翻译模型中进行处理,获取与所述第一语音信号对应的所述第二语种的文本信息;对所述第二语种的文本信息进行语音合成,获取对应的第二语音信号并播放。

【技术特征摘要】
1.一种翻译处理方法,其特征在于,包括以下步骤:获取第一语种的第一语音信号,按照预设算法提取所述第一语音信号的语音特征向量;将所述语音特征向量输入到预先训练的从第一语种语音到第二语种文本的端到端翻译模型中进行处理,获取与所述第一语音信号对应的所述第二语种的文本信息;对所述第二语种的文本信息进行语音合成,获取对应的第二语音信号并播放。2.如权利要求1所述的方法,其特征在于,所述按照预设算法提取所述第一语音信号的语音特征向量,包括:对所述第一语音信号进行梅尔频率倒谱分析生成第一维度的语音特征向量;根据所述端到端翻译模型的输入信息维度对所述第一维度的语音特征向量进行变换处理,生成与所述输入信息维度匹配的第二维度的语音特征向量。3.如权利要求1所述的方法,其特征在于,在将所述语音特征向量输入到预先训练的从第一语种语音到第二语种文本的端到端翻译模型中进行处理之前,还包括:获取所述第一语种的语音语料与对应的所述第二语种的文本语料的翻译训练语料;根据所述翻译训练语料训练预设模型的处理参数,生成所述端到端翻译模型。4.如权利要求3所述的方法,其特征在于,若所述第一语种和所述第二语种为小语种翻译,则所述获取所述第一语种的语音语料与对应的所述第二语种的文本语料的翻译训练语料,包括:通过语音识别系统对所述第一语种的语音语料进行识别处理获取所述第一语种的文本语料;通过翻译引擎将所述第一语种的文本语料翻译成所述第二语种的文本语料。5.如权利要求3所述的方法,其特征在于,所述获取所述第一语种的语音语料与对应的所述第二语种的文本语料的翻译训练语料,包括:获取经过人工标注的与所述第一语种的语音语料对应的第一语种的文本语料;通过翻译引擎将所述第一语种的文本语料翻译成所述第二语种的文本语料。6.一种翻译处理装置,其特征在于,包括:获取模块,用于获取第一语种的第...

【专利技术属性】
技术研发人员:熊皓何中军胡晓光吴华李芝忻舟吴甜王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1