一种基于深度神经网络技术的语音增强方法技术

技术编号：33123641 阅读：14 留言：0更新日期：2022-04-17 00:30

本申请公开了一种基于深度神经网络技术的语音增强方法，通过获取待处理语音数据；将待处理语音数据输入至预先训练的神经网络模型，获得神经网络模型输出的增强语音数据；增强语音数据为待处理语音数据滤除噪音数据后得到；其中，预先训练的神经网络模型包括编码结构和解码结构，通过对训练语音数据进行编码并传递给解码结构，并将相邻解码层之间的解码输出信息进行去除冗余和传递处理训练得到。以此，通过预先训练的神经网络模型对待处理语音数据进行处理，可以快速、有效抑制噪声数据，且预先训练的神经网络模型通过对解码输出信息进行去除冗余处理，更专注于有效信息，明显提升降噪效果。升降噪效果。升降噪效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度神经网络技术的语音增强方法

[0001]本申请涉及语音处理
，更具体地，涉及一种基于深度神经网络技术的语音增强方法。

技术介绍

[0002]相关技术中，获取的语音信号中常包括各种干扰噪声，语音增强技术是抑制其中的干扰噪声，增强有效语音的技术。
[0003]传统的语音信号处理中，常采用语音降噪算法实现语音增强。如此，需要进行噪声谱的估计，而噪声谱的跟踪估计需要花费一定时间才能准确的完成。因此，传统的信号处理方法无法快速处理瞬态的噪声。

技术实现思路

[0004]鉴于上述问题，本专利技术提出了一种基于深度神经网络技术的语音增强方法，以改善上述问题。
[0005]本申请实施例提供了一种基于深度神经网络技术的语音增强方法，该方法包括：获取待处理语音数据；将待处理语音数据输入至预先训练的神经网络模型，获得神经网络模型输出的增强语音数据；增强语音数据为待处理语音数据滤除噪音数据后得到；其中，预先训练的神经网络模型包括编码结构和解码结构，通过对训练语音数据进行编码并传递给解码结构，并将相邻解码层之间的解码输出信息进行去除冗余和传递处理训练得到。
[0006]在本申请的一些实施例中，基于前述方案，预先训练的神经网络模型还通过对训练语音数据进行语音识别处理训练得到。
[0007]在本申请的一些实施例中，基于前述方案，预先训练的神经网络模型为基于训练语音数据，对门控连接网络训练得到，门控连接网络包括编码结构、门控结构和解码结构。
[0008]在本申请的一些实施例中...

【技术保护点】

【技术特征摘要】
1.一种基于深度神经网络技术的语音增强方法，其特征在于，所述方法包括：获取待处理语音数据；将所述待处理语音数据输入至预先训练的神经网络模型，获得所述神经网络模型输出的增强语音数据；所述增强语音数据为所述待处理语音数据滤除噪音数据后得到；其中，所述预先训练的神经网络模型包括编码结构和解码结构，通过对训练语音数据进行编码并传递给所述解码结构，并将相邻解码层之间的解码输出信息进行去除冗余和传递处理训练得到。2.根据权利要求1所述的方法，其特征在于，所述预先训练的神经网络模型通过对所述训练语音数据进行语音识别处理训练得到。3.根据权利要求2所述的方法，其特征在于，所述预先训练的神经网络模型为基于所述训练语音数据，对门控连接网络训练得到，所述门控连接网络包括编码结构、门控结构和解码结构。4.根据权利要求3所述的方法，其特征在于，所述门控连接网络还包括时序结构，所述时序结构设置于所述编码结构和所述解码结构之间，所述时序结构用于获取所述编码输出信息中的时序信息。5.根据权利要求4所述的方法，其特征在于，所述门控连接网络还包括语音识别结构，所述语音识别结构与所述编码结构连接，所述语音识别结构用于对所述训练语音数据进行语音识别处理。6.根据权利要求3所述的方法，其特征在于，所述编码结构包括多个编码层，所述解码结构包括多个解码层；每个所述编码层的编码输出信息输入至与其对应的解码层；相邻解码层之间设置所述门控结构。7.根据权利要求5所述的方法，其特征在于，所述预先训练的神经网络模型通过如下步骤训练得到：获取训练语音数据，所述训练语音数据包括混合语音数据；获取门控连接网络；通过所述训练样本集合对所述门控连接网络进行训练，直至所述门控连接网络满足预设条件，得到训练后的门控连接网...

【专利技术属性】
技术研发人员：林嘉鑫，郑颖龙，吴广财，赖蔚蔚，郑杰生，周昉昉，陈颖璇，叶杭，黄宏恩，赖洁怡，翁睿琳，麦晓辉，何旻诺，
申请(专利权)人：广东电力信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人