语音翻译方法、装置及设备、翻译机制造方法及图纸

技术编号:27252485 阅读:20 留言:0更新日期:2021-02-04 12:30
本申请涉及一种语音翻译方法、装置及设备、翻译机,语音翻译方法包括:获取语音信息,通过语音信息确定说话人的声纹特征;通过说话人的声纹特征判断说话人是否是第一用户;若说话人是第一用户,确定第一用户的第一语言,基于第一语言识别语音信息,基于预先设置的第二语言,将识别后的信息转换成第二语言的信息;若说话人不是第一用户,确定预先设置的第二语言,基于第二语言识别语音信息,基于第一用户的第一语言,将识别后的信息转换成第一语言的信息。如此,无需建立语种识别模型,通过声纹识别即可解决多语种间的双语种识别问题以及双语种间的自动语音翻译选择问题,降低了翻译训练复杂度,有效提高了翻译效率。有效提高了翻译效率。有效提高了翻译效率。

【技术实现步骤摘要】
语音翻译方法、装置及设备、翻译机


[0001]本申请涉及语音翻译
,具体涉及一种语音翻译方法、装置及设备、翻译机。

技术介绍

[0002]语种识别在语音翻译场景中具有强烈的应用需求,如果没有语种识别,那么在利用翻译机翻译的过程中就需要人工干预语音识别引擎才能对语音进行识别。例如,在中英对话过程中,中文说话人需要人工通过实体或虚拟按键的方式触发中文识别引擎,利用中文识别引擎对说话音频进行语音识别,将语音信息转变为文本信息,继而通过中文到英文的翻译引擎将中文文本信息翻译成英文文本信息,最后再通过英文语音合成信息将英文文本信息转换为语音信息播放出来,让懂英文的人听清。
[0003]相关技术中,通过语种识别可以避免用户人工干预语音识别引擎的操作过程,但是如果要在多个语种内识别出指定说话音频的对应语种,其识别结果的准确率往往较低,且需要的音频时长也比较长。而如果采用两两语种进行识别,其识别准确度会有所上升,但是针对不同的两两语种都要进行语种识别模型的训练,而且训练的语音数据也不容易收集,可行性比较差。

技术实现思路

[0004]有鉴于此,本申请的目的在于克服现有技术的不足,提供一种语音翻译方法、装置及设备、翻译机。
[0005]为实现以上目的,本申请采用如下技术方案:
[0006]本申请的第一方面提供一种语音翻译方法,包括:
[0007]获取语音信息,通过所述语音信息确定说话人的声纹特征;
[0008]通过所述说话人的声纹特征判断所述说话人是否是第一用户;
[0009]若所述说话人是第一用户,确定所述第一用户的第一语言,基于所述第一语言识别所述语音信息,基于预先设置的第二语言,将识别后的信息转换成第二语言的信息;
[0010]若所述说话人不是第一用户,确定预先设置的第二语言,基于所述第二语言识别所述语音信息,基于所述第一用户的第一语言,将识别后的信息转换成第一语言的信息。
[0011]可选的,所述获取语音信息之前,所述方法还包括:
[0012]采集所述第一用户的语音样本信息;
[0013]对所述语音样本信息进行特征提取,判断提取到的特征是否符合预设要求;
[0014]若符合,将所述特征输入到预先训练好的声纹模型中,得到特征向量;
[0015]将所述特征向量作为所述第一用户的声纹特征进行存储。
[0016]可选的,所述预设要求包括:
[0017]采集到的语音样本信息的时长符合预设时长;
[0018]和/或,采集到的语音样本信息的内容符合预设内容。
[0019]可选的,所述基于所述第一语言识别所述语音信息,基于预先设置的第二语言,将识别后的信息转换成第二语言的信息,包括:
[0020]基于所述第一语言,将所述语音信息转换为第一语言的文本信息,基于预先设置的第二语言,将第一语言的文本信息转换成第二语言的文本信息;
[0021]所述基于所述第二语言识别所述语音信息,基于所述第一用户的第一语言,将识别后的信息转换成第一语言的信息,包括:
[0022]基于所述第二语言,将所述语音信息转换为第二语言的文本信息,基于预先设置的第一语言,将第二语言的文本信息转换成第一语言的文本信息。
[0023]可选的,所述将识别后的信息转换成第二语言的信息之后,所述方法还包括:
[0024]播放所述第二语言的信息;
[0025]所述将识别后的信息转换成第一语言的信息之后,所述方法还包括:
[0026]播放所述第一语言的信息。
[0027]可选的,所述通过所述说话人的声纹特征判断所述说话人是否是第一用户,包括:
[0028]从预先建立的所述声纹特征与所述第一用户的对应关系中,查找是否存在与所述说话人的声纹特征对应的所述声纹特征;
[0029]若存在,则确定所述说话人是第一用户;若不存在,则确定所述说话人不是第一用户。
[0030]可选的,所述通过所述语音信息确定说话人的声纹特征,包括:
[0031]提取所述语音信息的FBANK特征,并将提取到的FBANK特征输入到预先训练好的声纹模型中,得到特征向量;
[0032]将得到的特征向量作为所述说话人的声纹特征。
[0033]本申请的第二方面提供一种语音翻译装置,包括:
[0034]获取模块,用于获取语音信息,通过所述语音信息确定说话人的声纹特征;
[0035]判断模块,用于通过所述说话人的声纹特征判断所述说话人是否是第一用户;
[0036]第一转换模块,用于若所述说话人是第一用户,确定所述第一用户的第一语言,基于所述第一语言识别所述语音信息,基于预先设置的第二语言,将识别后的信息转换成第二语言的信息;
[0037]第二转换模块,用于若所述说话人不是第一用户,确定预先设置的第二语言,基于所述第二语言识别所述语音信息,基于所述第一用户的第一语言,将识别后的信息转换成第一语言的信息。
[0038]本申请的第三方面提供一种语音翻译设备,包括:
[0039]处理器,以及与所述处理器相连接的存储器;
[0040]所述存储器用于存储计算机程序;
[0041]所述处理器用于调用并执行所述存储器中的所述计算机程序,以执行如本申请的第一方面所述的方法。
[0042]本申请的第四方面提供一种翻译机,包括如本申请的第三方面所述的语音翻译设备。
[0043]本申请提供的技术方案可以包括以下有益效果:
[0044]本申请的方案中,在获取到语音信息后,通过获取到的语音信息,可以提取到说话
人的声纹特征;通过说话人的声纹特征,可以判断出当前说话人是否是第一用户,从而确定出说话人的身份;若说话人是第一用户,则可以确定第一用户的第一语言,基于第一语言可以识别出语音信息的内容,然后基于预先设置的第二语言,可以将识别后的信息转换成第二语言的信息,如此,即可以将第一语言的语音信息翻译成第二语言的语音信息;相应的,若说话人不是第一用户,则可以确定语音信息的语言为预先设置的第二语言,基于第二语言可以识别出语音信息的内容,然后基于第一用户的第一语言,可以将识别后的信息转换成第二语言的信息,如此,即可将第二语言的语音信息翻译成第一语言的信息。通过上述方法,避免了对传统的语种识别模型的训练,解决了多语种间的双语种识别问题以及双语种间的自动语音翻译选择问题,降低了语音翻译的训练复杂度,有效提高了语音翻译效率。
附图说明
[0045]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0046]图1是本申请一个实施例提供的一种语音翻译方法的流程图。
[0047]图2是本申请另一个实施例提供的一种语音翻译装置的结构示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音翻译方法,其特征在于,包括:获取语音信息,通过所述语音信息确定说话人的声纹特征;通过所述说话人的声纹特征判断所述说话人是否是第一用户;若所述说话人是第一用户,确定所述第一用户的第一语言,基于所述第一语言识别所述语音信息,基于预先设置的第二语言,将识别后的信息转换成第二语言的信息;若所述说话人不是第一用户,确定预先设置的第二语言,基于所述第二语言识别所述语音信息,基于所述第一用户的第一语言,将识别后的信息转换成第一语言的信息。2.根据权利要求1所述的语音翻译方法,其特征在于,所述获取语音信息之前,所述方法还包括:采集所述第一用户的语音样本信息;对所述语音样本信息进行特征提取,判断提取到的特征是否符合预设要求;若符合,将所述特征输入到预先训练好的声纹模型中,得到特征向量;将所述特征向量作为所述第一用户的声纹特征进行存储。3.根据权利要求2所述的语音翻译方法,其特征在于,所述预设要求包括:采集到的语音样本信息的时长符合预设时长;和/或,采集到的语音样本信息的内容符合预设内容。4.根据权利要求1所述的语音翻译方法,其特征在于,所述基于所述第一语言识别所述语音信息,基于预先设置的第二语言,将识别后的信息转换成第二语言的信息,包括:基于所述第一语言,将所述语音信息转换为第一语言的文本信息,基于预先设置的第二语言,将第一语言的文本信息转换成第二语言的文本信息;所述基于所述第二语言识别所述语音信息,基于所述第一用户的第一语言,将识别后的信息转换成第一语言的信息,包括:基于所述第二语言,将所述语音信息转换为第二语言的文本信息,基于预先设置的第一语言,将第二语言的文本信息转换成第一语言的文本信息。5.根据权利要求1所述的语音翻译方法,其特征在于,所述将识别后的信息转换成...

【专利技术属性】
技术研发人员:张明关磊
申请(专利权)人:北京分音塔科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1