一种语音降噪处理方法、电子设备及存储介质技术

技术编号：38742976 阅读：10 留言：0更新日期：2023-09-08 23:26

本申请实施例提供一种语音降噪处理方法、电子设备及存储介质，包括：S10，建立训练样本；所述训练样本中包括：弱噪声环境下的第一语音数据、以及强噪声环境下的第二语音数据；S20，对训练样本中的第一语音数据和第二语音数据进行融合，得到语音降噪训练数据；S30，对语音降噪训练数据进行分帧，获得多帧语音降噪训练数据单元；S40，通过第一语音数据、多帧语音降噪训练数据单元对生成式对抗网络模型进行训练，得到训练后的生成式对抗网络模型；S50，通过训练后的生成式对抗网络模型对待处理的语音识别数据进行降噪，获得目标语音识别数据；具有降噪效果较好的有益效果，适用于语音降噪的技术领域。的技术领域。的技术领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音降噪处理方法、电子设备及存储介质

[0001]本申请涉及语音降噪的
，具体涉及一种语音降噪处理方法、电子设备及存储介质。

技术介绍

[0002]移动通讯技术的发展，尤其是语音、视频等交互式实时通讯软件(如微信、QQ)的发展，极大的拉近了通讯双方的空间距离，起到了消离时空隔阂的作用与效果。
[0003]然而，在实时语音及视频通讯中，信号采集不可避免的会带有非目标通讯者的噪声，严重影响交互中的语音品质以及软件应用的体验感；因此，语音降噪是交互式语音应用中不可缺少的重要组成。
[0004]噪声按照时间变化的特性，又可以分为稳态噪声和非稳态噪声。当声音强度起伏小于l0dB的连续噪声被认为是稳态噪声，而起伏大于10dB的连续噪声和脉冲噪声被认为是非稳态噪声；其中：非稳态噪声具有相当的不稳定特性。
[0005]在传统的语音降噪中，通常在时频域利用统计学模型对语音和噪声进行建模，从而去除噪声；由于稳态噪声的频率比较固定，传统的语音降噪对于该类型的噪声具有较好的效果；然而，对于非稳态噪声的去除，则具有较大的缺陷，导致除噪效果差。

技术实现思路

[0006]为了解决上述技术缺陷之一，本申请实施例中提供了一种降噪效果较好的语音降噪处理方法、电子设备及存储介质。
[0007]根据本申请实施例的第一个方面，提供了一种语音降噪处理方法，包括：
[0008]S10，建立训练样本；所述训练样本中包括：弱噪声环境下的第一语音数据、以及强噪声环境下的第二语音数据；
[000...

【技术保护点】

【技术特征摘要】
1.一种语音降噪处理方法，其特征在于，包括：S10，建立训练样本；所述训练样本中包括：弱噪声环境下的第一语音数据、以及强噪声环境下的第二语音数据；S20，对训练样本中的第一语音数据和第二语音数据进行融合，得到语音降噪训练数据；S30，对语音降噪训练数据进行分帧，获得多帧语音降噪训练数据单元；S40，通过第一语音数据、多帧语音降噪训练数据单元对生成式对抗网络模型进行训练，得到训练后的生成式对抗网络模型；S50，通过训练后的生成式对抗网络模型对待处理的语音识别数据进行降噪，获得目标语音识别数据。2.根据权利要求1所述的一种语音降噪处理方法，其特征在于，还包括：S60，生成所述目标语音识别数据所指示的深度处理的中间训练数据的可视化图表。3.根据权利要求1所述的一种语音降噪处理方法，其特征在于，所述S40，通过第一语音数据、多帧语音降噪训练数据单元对生成式对抗网络模型进行训练，得到训练后的生成式对抗网络模型；包括：利用语音降噪训练数据对预先构建的生成器和判别器分类模型进行交替训练，直至满足预设迭代结束条件；其中：所述交替训练包括：固定所述生成器的损失函数，基于所述语音降噪训练数据和生成器生成的数据，对所述判别器分类模型进行训练；固定所述判别器的损失函数，对所述生成器进行训练。4.根据权利要求3所述的一种语音降噪处理方法，其特征在于，所述固定所述判别器的损失函数，对所述生成器进行训练，包括：S401，将多帧语音降噪训练数据单元输入至生成器，得到第一降噪数据；S402，将第一降噪数据数输入至判别器中，得到第一判别结果；S403，基于第一语音数据和第一降噪数据之间的误差，建立损失函数；...

【专利技术属性】
技术研发人员：高宝明，王志宇，孙国繁，高磊，蔡晓龙，张阳阳，张广勇，
申请(专利权)人：国网山西省电力公司超高压变电分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人