语音识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:38358760 阅读:15 留言:0更新日期:2023-08-05 17:29
本申请实施例提供一种语音识别方法、装置、设备及计算机可读存储介质,语音识别方法包括:获取待识别的目标语音信号;将目标语音信号输入已训练的语音模型,得到目标语音信号的信噪比信息;根据信噪比信息对应的降噪参数对目标语音信号进行降噪,得到降噪语音信号;根据降噪语音信号,得到目标语音信号的语音识别结果。本申请实施例利用语音模型得到信噪比信息,并基于信噪比信息对语音信号进行自适应的降噪,所得到的降噪语音信息即有效消除了目标语音信号中的噪音干扰信号,同时又避免了目标语音信号的失真,可以用于识别得到更准确的语音识别结果,在不同的场景下均有良好的语音识别精度。识别精度。识别精度。

【技术实现步骤摘要】
语音识别方法、装置、设备及计算机可读存储介质


[0001]本申请实施例涉及语音处理
,具体涉及一种语音识别方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]语音识别是一种常见的语音处理技术,能够将语音转化为文字,在实际生活中有着广泛的应用。目前比较常用到的语音识别是利用通过深度学习训练得到的语音识别模型来实现的。
[0003]然而,在实际应用过程中发现,现有训练得到的语音识别模型对部分场景下的语音信号,例如公路,市场场景下的语音信号识别结果不够精确。

技术实现思路

[0004]本申请实施例提供一种语音识别方法、装置、设备及计算机可读存储介质,旨在解决现有语音识别技术中存在的部分场景识别结果不够精确的技术问题。
[0005]一方面,本申请实施例提供一种语音识别方法,包括:
[0006]获取待识别的目标语音信号;
[0007]将所述目标语音信号输入已训练的语音模型,得到所述目标语音信号的信噪比信息;
[0008]根据所述信噪比信息对应的降噪参数对所述目标语音信号进行降噪,得到降噪语音信号;
[0009]根据所述降噪语音信号,得到所述目标语音信号的语音识别结果。
[0010]作为本申请的一种可行实施例,所述将所述目标语音信号输入已训练的语音模型,得到所述目标语音信号的信噪比信息,包括:
[0011]将所述目标语音信号输入已训练的语音模型中的特征提取器,得到所述目标语音信号的音频特征;
[0012]将所述音频特征输入已训练的语音模型中的分类器,得到所述目标语音信号的信噪比信息。
[0013]作为本申请的一种可行实施例,所述将所述音频特征输入已训练的语音模型中的分类器,得到所述目标语音信号的信噪比信息之前,所述方法还包括:
[0014]获取样本语音信号;
[0015]提取所述样本语音信号的音频特征;
[0016]将所述样本语音信号的音频特征输入预设初始语音模型中的初始分类器,得到所述样本语音信号的预测信噪比信息;
[0017]根据所述预测信噪比信息和所述样本语音信号对应的标签信噪比信息,计算所述初始分类器的损失值;
[0018]根据所述损失值对所述初始分类器的参数进行更新,得到已训练的语音模型。
[0019]作为本申请的一种可行实施例,所述根据所述信噪比信息对应的降噪参数对所述目标语音信号进行降噪,得到降噪语音信号,包括:
[0020]根据所述信噪比信息与预设信噪比阈值的大小关系,确定所述信噪比信息对应的降噪参数;
[0021]根据所述降噪参数对所述目标语音信号进行降噪,得到降噪语音信号。
[0022]作为本申请的一种可行实施例,所述根据所述降噪语音信号,得到所述目标语音信号的语音识别结果,包括:
[0023]将所述降噪语音信号输入所述语音模型中的语音识别器,得到第一语音识别结果;
[0024]将所述目标语音信号输入所述语音模型中的语音识别器,得到第二语音识别结果;
[0025]根据所述第一语音识别结果和所述第二语音识别结果,确定所述目标语音信号的语音识别结果。
[0026]作为本申请的一种可行实施例,所述根据所述第一语音识别结果和所述第二语音识别结果,确定所述目标语音信号的语音识别结果,包括:
[0027]获取所述第一语音识别结果对应的第一置信度,和所述第二语音识别结果对应的第二置信度;
[0028]根据所述第一置信度和第二置信度的大小关系,从所述第一语音识别结果和所述第二语音识别结果中确定目标语音信号的语音识别结果。
[0029]作为本申请的一种可行实施例,所述将所述目标语音信号输入已训练的语音模型,得到所述目标语音信号的信噪比信息,包括:
[0030]根据所述目标语音信号的信号长度和预设长度阈值的大小关系,对所述目标语音信号进行划分,得到语音信号片段;
[0031]将所述语音信号片段输入已训练的语音模型,得到所述语音信号片段的信噪比信息。
[0032]另一方面,本申请实施例还提供一种语音识别装置,包括:
[0033]获取模块,用于获取待识别的目标语音信号;
[0034]分类模块,用于将所述目标语音信号输入已训练的语音模型,得到所述目标语音信号的信噪比信息;
[0035]降噪模块,用于根据所述信噪比信息对应的降噪参数对所述目标语音信号进行降噪,得到降噪语音信号;
[0036]识别模块,用于根据所述降噪语音信号,得到所述目标语音信号的语音识别结果。
[0037]另一方面,本申请实施例还提供一种语音识别设备,所述语音识别设备包括处理器、存储器以及存储于所述存储器中并可在所述处理器上运行的语音识别程序,所述处理器执行所述语音识别程序以实现上述的语音识别方法中的步骤。
[0038]另一方面,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有语音识别程序,所述语音识别程序被处理器执行以实现上述的语音识别方法中的步骤。
[0039]本申请实施例提供的语音识别方法,在获取到目标语音信号后,利用训练好的语
音模型得到信噪比信息,并基于信噪比信息所对应的降噪参数对语音信号进行自适应的降噪,所得到的降噪语音信息即有效消除了在噪音干扰大的场景下目标语音信号中的噪音干扰信号,同时又有效避免了在噪音干扰小的场景下目标语音信号的失真,最终利用降噪语音信息所得到的语音识别结果更加准确,本申请实施例提供的语音识别方法,可以适用于不同的场景,在不同的场景下均有良好的语音识别精度。
附图说明
[0040]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0041]图1为本申请实施例提供的一种语音识别方法的实现场景示意图;
[0042]图2为本申请实施例提供的一种语音识别方法的步骤流程示意图;
[0043]图3为本申请实施例提供的一种确定目标语音信号的信噪比信息的步骤流程示意图;
[0044]图4为本申请实施例提供的一种训练分类器的步骤流程示意图;
[0045]图5为本申请实施例提供的一种对目标语音信号进行降噪得到降噪语音信号的步骤流程示意图;
[0046]图6为本申请实施例提供的一种得到语音识别结果的步骤流程示意图;
[0047]图7为本申请实施例提供的一种根据第一语音识别结果和第二语音识别结果确定最终语音识别结果的步骤流程示意图;
[0048]图8为本申请实施例提供的另一种确定目标语音信号的信噪比信息的步骤流程示意图;
[0049]图9为本申请实施例提供的一种语音识别装置的结构示意图;
[0050]图10为本申请实施例提供的一种语音识别设备的结构示意图。
具体实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:获取待识别的目标语音信号;将所述目标语音信号输入已训练的语音模型,得到所述目标语音信号的信噪比信息;根据所述信噪比信息对应的降噪参数对所述目标语音信号进行降噪,得到降噪语音信号;根据所述降噪语音信号,得到所述目标语音信号的语音识别结果。2.根据权利要求1所述的语音识别方法,其特征在于,所述将所述目标语音信号输入已训练的语音模型,得到所述目标语音信号的信噪比信息,包括:将所述目标语音信号输入已训练的语音模型中的特征提取器,得到所述目标语音信号的音频特征;将所述音频特征输入已训练的语音模型中的分类器,得到所述目标语音信号的信噪比信息。3.根据权利要求2所述的语音识别方法,其特征在于,所述将所述音频特征输入已训练的语音模型中的分类器,得到所述目标语音信号的信噪比信息之前,所述方法还包括:获取样本语音信号;提取所述样本语音信号的音频特征;将所述样本语音信号的音频特征输入预设初始语音模型中的初始分类器,得到所述样本语音信号的预测信噪比信息;根据所述预测信噪比信息和所述样本语音信号对应的标签信噪比信息,计算所述初始分类器的损失值;根据所述损失值对所述初始分类器的参数进行更新,得到已训练的语音模型。4.根据权利要求1所述的语音识别方法,其特征在于,所述根据所述信噪比信息对应的降噪参数对所述目标语音信号进行降噪,得到降噪语音信号,包括:根据所述信噪比信息与预设信噪比阈值的大小关系,确定所述信噪比信息对应的降噪参数;根据所述降噪参数对所述目标语音信号进行降噪,得到降噪语音信号。5.根据权利要求1所述的语音识别方法,其特征在于,所述根据所述降噪语音信号,得到所述目标语音信号的语音识别结果,包括:将所述降噪语音信号输入所述语音模型中的语音识别器,得到第一语音识别结果;将所述目标语音信号输入所...

【专利技术属性】
技术研发人员:何淑琳
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1