【技术实现步骤摘要】
语音翻译方法、装置、电子设备及存储介质
本公开实施例涉及语音识别领域,尤其涉及一种语音翻译方法、装置、电子设备及存储介质。
技术介绍
同声传译是指译员在不打断讲话者讲话的情况下,不间断地将内容口译给听众的一种翻译方式。目前实现同声传译的方式为:将源语音识别成第一语言的文本,将第一语言的文本机器翻译成第二语言的文本,基于第二语言的文本生成目标语言的语音。但这种方式只能实现从某一语言的语音到另一语言的语音,也即只能支持语音之间一一互译。此外,这种方式需要经过语音到文本、文本翻译、翻译文本到语音三个步骤,语音翻译的时间长,且每个步骤均会产生误差,而且前一步骤的误差会延续倒下一步骤,从而降低语音翻译的准确率。
技术实现思路
本公开实施例提供一种语音翻译方法、装置、电子设备及存储介质,可以实现多语言语音翻译,以及提高语音翻译的效率和准确率。第一方面,本公开实施例提供了一种语音翻译方法,包括:获取待翻译语言对应的源语音;获取指定的目标语言;将所述源语音和与所述目标语言匹 ...
【技术保护点】
1.一种语音翻译方法,其特征在于,包括:/n获取待翻译语言对应的源语音;/n获取指定的目标语言;/n将所述源语音和与所述目标语言匹配的指示信息输入到预先训练的语音翻译模型中,所述语音翻译模型用于将第一语言集合中的语言翻译成第二语言集合中的语言,所述第一语言集合包括多个语言,所述第一语言集合包括所述待翻译语言,所述第二语言集合包括多个语言,所述第二语言集合包括所述目标语言;/n获取所述语音翻译模型输出的与所述目标语言对应的翻译语音,其中,所述待翻译语言与所述目标语言不同。/n
【技术特征摘要】
1.一种语音翻译方法,其特征在于,包括:
获取待翻译语言对应的源语音;
获取指定的目标语言;
将所述源语音和与所述目标语言匹配的指示信息输入到预先训练的语音翻译模型中,所述语音翻译模型用于将第一语言集合中的语言翻译成第二语言集合中的语言,所述第一语言集合包括多个语言,所述第一语言集合包括所述待翻译语言,所述第二语言集合包括多个语言,所述第二语言集合包括所述目标语言;
获取所述语音翻译模型输出的与所述目标语言对应的翻译语音,其中,所述待翻译语言与所述目标语言不同。
2.根据权利要求1所述的方法,其特征在于,所述获取所述语音翻译模型输出的与所述目标语言对应的翻译语音,包括:
通过所述语音翻译模型中的编码器提取所述源语音中的语音特征,并进行编码,形成所述源语音的特征向量;其中,所述语音翻译模型为Seq2Seq模型;
通过所述语音翻译模型中的解码器根据所述特征向量和所述目标语言,将所述特征向量映射为目标语言的语音序列,作为翻译语音。
3.根据权利要求2所述的方法,其特征在于,所述通过所述语音翻译模型中的编码器提取所述源语音中的语音特征,并进行编码,形成所述源语音的特征向量,包括:
通过所述编码器对所述源语音进行切分,形成至少一个源语音片段;
通过所述编码器获取各所述源语音片段以及所述源语音的语音特征,形成至少一个语音元素,所述语音特征包括下述至少一项:时长、频率、音强、音色和频谱特性;
通过所述编码器根据各所述语音元素依次对初始向量进行变换,形成特征向量。
4.根据权利要求2所述的方法,其特征在于,所述通过所述语音翻译模型中的解码器根据所述特征向量和所述目标语言,将所述特征向量映射为目标语言的语音序列,包括:
通过所述解码器对所述特征向量进行解析,确定至少一个备选翻译语音片段;
从至少一个备选翻译语音片段中查询与...
【专利技术属性】
技术研发人员:王明轩,董倩倩,李磊,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。