一种基于深度神经网络技术的语音增强方法技术

技术编号:33123641 阅读:14 留言:0更新日期:2022-04-17 00:30
本申请公开了一种基于深度神经网络技术的语音增强方法,通过获取待处理语音数据;将待处理语音数据输入至预先训练的神经网络模型,获得神经网络模型输出的增强语音数据;增强语音数据为待处理语音数据滤除噪音数据后得到;其中,预先训练的神经网络模型包括编码结构和解码结构,通过对训练语音数据进行编码并传递给解码结构,并将相邻解码层之间的解码输出信息进行去除冗余和传递处理训练得到。以此,通过预先训练的神经网络模型对待处理语音数据进行处理,可以快速、有效抑制噪声数据,且预先训练的神经网络模型通过对解码输出信息进行去除冗余处理,更专注于有效信息,明显提升降噪效果。升降噪效果。升降噪效果。

【技术实现步骤摘要】
一种基于深度神经网络技术的语音增强方法


[0001]本申请涉及语音处理
,更具体地,涉及一种基于深度神经网络技术的语音增强方法。

技术介绍

[0002]相关技术中,获取的语音信号中常包括各种干扰噪声,语音增强技术是抑制其中的干扰噪声,增强有效语音的技术。
[0003]传统的语音信号处理中,常采用语音降噪算法实现语音增强。如此,需要进行噪声谱的估计,而噪声谱的跟踪估计需要花费一定时间才能准确的完成。因此,传统的信号处理方法无法快速处理瞬态的噪声。

技术实现思路

[0004]鉴于上述问题,本专利技术提出了一种基于深度神经网络技术的语音增强方法,以改善上述问题。
[0005]本申请实施例提供了一种基于深度神经网络技术的语音增强方法,该方法包括:获取待处理语音数据;将待处理语音数据输入至预先训练的神经网络模型,获得神经网络模型输出的增强语音数据;增强语音数据为待处理语音数据滤除噪音数据后得到;其中,预先训练的神经网络模型包括编码结构和解码结构,通过对训练语音数据进行编码并传递给解码结构,并将相邻解码层之间的解码输出信息进行去除冗余和传递处理训练得到。
[0006]在本申请的一些实施例中,基于前述方案,预先训练的神经网络模型还通过对训练语音数据进行语音识别处理训练得到。
[0007]在本申请的一些实施例中,基于前述方案,预先训练的神经网络模型为基于训练语音数据,对门控连接网络训练得到,门控连接网络包括编码结构、门控结构和解码结构。
[0008]在本申请的一些实施例中,基于前述方案,门控连接网络还包括时序结构,时序结构设置于编码结构和解码结构之间,时序结构用于获取编码输出信息中的时序信息。
[0009]在本申请的一些实施例中,基于前述方案,门控连接网络还包括语音识别结构,语音识别结构与编码结构连接,语音识别结构用于对训练语音数据进行语音识别处理。
[0010]在本申请的一些实施例中,基于前述方案,编码结构包括多个编码层,解码结构包括多个解码层;每个编码层的编码输出信息输入至与其对应的解码层;相邻解码层之间设置门控结构。
[0011]在本申请的一些实施例中,基于前述方案,预先训练的神经网络模型通过如下步骤训练得到:获取训练语音数据,训练语音数据包括混合语音数据;获取门控连接网络,门控连接网络包括编码结构、门控结构和解码结构;通过训练样本集合对门控连接网络进行训练,直至门控连接网络满足预设条件,得到训练后的门控连接网络作为预先训练的神经网络模型;其中,编码结构用于对训练语音数据进行编码获得编码输出信息,门控结构用于对解码输出信息进行去除冗余和传递处理获得关键解码输出信息,解码结构用于根据编码
输出信息和关键解码输出信息获得训练语音数据对应的增强语音数据;时序结构用于根据编码输出信息获取时序信息,并传递给解码结构;语音识别结构用于根据编码输出信息确定训练语音数据是否包括目标语音数据。
[0012]在本申请的一些实施例中,基于前述方案,通过对训练样本集合对门控连接网络进行训练,直至门控连接网络满足预设条件,包括:将训练语音数据输入编码结构,通过编码结构生成训练语音数据对应的编码输出信息;将编码输出信息输入至解码结构,通过解码结构和门控结构输出与训练语音数据对应的增强语音数据;将编码输出信息输入至语音识别结构,通过语音识别结构生成语音数据对应的语音识别结果;根据增强语音数据、语音识别结果获取门控连接网络的总损失值;根据总损失值对门控连接网络进行迭代训练,直至门控连接网络满足预设条件。
[0013]在本申请的一些实施例中,基于前述方案,根据总损失值对增强语音数据、语音识别结果获取门控连接网络的总损失值,包括:根据增强语音数据获取门控连接网络的第一损失值;根据语音识别结果获取门控连接网络的第二损失值;基于第一损失值以及第二损失值,确定门控连接网络的总损失值。
[0014]在本申请的一些实施例中,基于前述方案,混合语音数据通过向干净语音数据中混合噪声数据得到。
[0015]本专利技术提供的技术方案,通过获取待处理语音数据;将待处理语音数据输入至预先训练的神经网络模型,获得神经网络模型输出的增强语音数据;增强语音数据为待处理语音数据滤除噪音数据后得到;其中,预先训练的神经网络模型包括编码结构和解码结构,通过对训练语音数据进行编码并传递给解码结构,并将相邻解码层之间的解码输出信息进行去除冗余和传递处理训练得到。以此,通过预先训练的神经网络模型对待处理语音数据进行处理,可以快速、有效抑制噪声数据,且预先训练的神经网络模型通过对解码输出信息进行去除冗余处理,更专注于有效信息,明显提升降噪效果。
附图说明
[0016]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例及附图,都属于本专利技术保护的范围。
[0017]图1示出了本申请一实施例提出的一种基于深度神经网络技术的语音增强方法的流程示意图。
[0018]图2示出了本申请一实施例提出的一种门控连接网络的结构示意图。
[0019]图3示出了图2中门控结构的连接示意图。
[0020]图4示出了本申请另一实施例提出的一种门控连接网络的结构示意图。
[0021]图5示出了本申请一实施例中门控连接网络训练过程的流程示意图。
[0022]图6示出了本申请一实施例提出的一种基于深度神经网络技术的语音增强装置的结构框图。
[0023]图7示出了本申请一实施例提出的一种电子设备的结构框图。
[0024]图8示出了本申请一实施例提出的一种计算机可读取存储介质的结构框图。
具体实施方式
[0025]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0026]相关技术中,获取的语音信号中常包括各种干扰噪声,语音增强技术是抑制其中的干扰噪声,增强有效语音的技术。
[0027]传统的语音信号处理中,常采用语音降噪算法实现语音增强,例如维纳滤波(wiener filter)、自适应滤波(LMS,Least Mean Square),最小均方误差(MMSE

LSA,Minimum Mean

Square Error Log

Spectral Amplitude)等方法实现语音降噪。
[0028]而采用语音降噪算法实现语音增强,需要进行噪声谱的估计,而噪声谱的跟踪估计需要花费一定时间才能准确的完成。因此,传统的信号处理方法无法快速处理瞬态的噪声。
[0029]为了改善上述技术问题,专利技术人提出了本申请提供的一种基于深度神经网络技术的语音增强方法,通过获取待处理语音数据;将待处理语音数据输入至预先训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度神经网络技术的语音增强方法,其特征在于,所述方法包括:获取待处理语音数据;将所述待处理语音数据输入至预先训练的神经网络模型,获得所述神经网络模型输出的增强语音数据;所述增强语音数据为所述待处理语音数据滤除噪音数据后得到;其中,所述预先训练的神经网络模型包括编码结构和解码结构,通过对训练语音数据进行编码并传递给所述解码结构,并将相邻解码层之间的解码输出信息进行去除冗余和传递处理训练得到。2.根据权利要求1所述的方法,其特征在于,所述预先训练的神经网络模型通过对所述训练语音数据进行语音识别处理训练得到。3.根据权利要求2所述的方法,其特征在于,所述预先训练的神经网络模型为基于所述训练语音数据,对门控连接网络训练得到,所述门控连接网络包括编码结构、门控结构和解码结构。4.根据权利要求3所述的方法,其特征在于,所述门控连接网络还包括时序结构,所述时序结构设置于所述编码结构和所述解码结构之间,所述时序结构用于获取所述编码输出信息中的时序信息。5.根据权利要求4所述的方法,其特征在于,所述门控连接网络还包括语音识别结构,所述语音识别结构与所述编码结构连接,所述语音识别结构用于对所述训练语音数据进行语音识别处理。6.根据权利要求3所述的方法,其特征在于,所述编码结构包括多个编码层,所述解码结构包括多个解码层;每个所述编码层的编码输出信息输入至与其对应的解码层;相邻解码层之间设置所述门控结构。7.根据权利要求5所述的方法,其特征在于,所述预先训练的神经网络模型通过如下步骤训练得到:获取训练语音数据,所述训练语音数据包括混合语音数据;获取门控连接网络;通过所述训练样本集合对所述门控连接网络进行训练,直至所述门控连接网络满足预设条件,得到训练后的门控连接网...

【专利技术属性】
技术研发人员:林嘉鑫郑颖龙吴广财赖蔚蔚郑杰生周昉昉陈颖璇叶杭黄宏恩赖洁怡翁睿琳麦晓辉何旻诺
申请(专利权)人:广东电力信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1