语音降噪方法、处理终端及存储介质技术

技术编号：40484126 阅读：7 留言：0更新日期：2024-02-26 19:17

本发明专利技术提供一种语音降噪方法、处理终端及存储介质。该方法包括：对当前帧语音数据进行傅里叶变换，得到傅里叶变换频谱；将傅里叶变换频谱输入神经网络模型进行噪声估计得到噪声谱，并根据噪声谱确定各频点的增益系数；根据各个频点的增益系数乘以傅里叶变换频谱，得到降噪后的频谱；对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据。本发明专利技术采用神经网络计算噪声谱，进而根据噪声谱对语音数据进行降噪，并不直接采用神经网络模型降噪，降低了计算量，同时对平稳噪声和非平稳噪声均可进行更准确的估计，准确率高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音处理，尤其涉及一种语音降噪方法、处理终端及存储介质。

技术介绍

1、由于环境中存在大量的噪音，电子设备在采集语音信号的过程中不可避免的会同时采集得到噪音信号，从而使得语音信号受噪音污染，不纯净。因此，需要对采集得到的语音信号进行去噪，提取出纯净的语音信号。

2、现有技术中，基于神经网络模型自学习的特性，可采用神经网络模型自适应地学习不同类型和程度的噪声，从而对语音信号进行去噪。但由于神经网络模型对于复杂和高维度的数据结构不够灵活，导致其用于对语音信号去噪时计算复杂，准确度不够高。

技术实现思路

1、本专利技术实施例提供了一种语音降噪方法、处理终端及存储介质，以解采用神经网络模型对语音信号去噪，计算量大，准确率不够高的问题。

2、第一方面，本专利技术实施例提供了一种语音降噪方法，包括：

3、对当前帧语音数据进行傅里叶变换，得到傅里叶变换频谱；

4、将傅里叶变换频谱输入神经网络模型进行噪声估计得到噪声谱，并根据噪声谱确定各频点的增益系数；

5、根据各个频点的增益系数乘以傅里叶变换频谱，得到降噪后的频谱；

6、对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据。

7、可选的，根据噪声谱确定各频点的增益系数，包括：

8、根据噪声谱，确定各频点的先验信噪比和后验信噪比；

9、根据各频点的先验信噪比和后验信噪比，确定各频点的增益系数。

10、可选的，根

11、根据各频点的先验信噪比和后验信噪比，确定各频点语音存在时的条件增益；

12、根据各频点的先验信噪比和后验信噪比，确定各频点语音存在的概率；

13、根据各频点语音存在时的条件增益及各频点语音存在时的条件增益，确定各频点的增益系数。

14、可选的，根据各频点的先验信噪比和后验信噪比，确定各频点语音存在的概率，包括：

15、根据各频点的先验信噪比进行决策，确定各频点语音缺失的概率；

16、根据各频点语音缺失的概率、各频点的先验信噪比和后验信噪比，确定各频点语音存在的概率。

17、可选的，当前帧语音数据的点数为2n；当前帧语音数据中的前n个点的数据与上一帧语音数据中的后n个点的数据重合；在对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据之后，方法还包括：

18、将上一帧降噪后的语音数据中的后n个点的语音数据，与当前帧降噪后的语音数据中的前n个点的语音数据平均，得到该n个点降噪后的语音数据。

19、可选的，在对当前帧语音数据进行傅里叶变换，得到傅里叶变换频谱之前，上述方法还可以包括：

20、对待检测语音数据进行加窗，得到当前帧语音数据。

21、可选的，当前帧语音数据的点数为2n；当前帧语音数据中的前n个点的数据与上一帧语音数据中的后n个点的数据重合；在对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据之后，上述方法还包括：

22、将上一帧降噪后的语音数据中的后n个点的语音数据，与当前帧降噪后的语音数据中的前n个点的语音数据相加，得到该n个点降噪后的语音数据。

23、可选的，神经网络模型为gru模型、lstm模型、cnn模型或dnn模型。

24、第二方面，本专利技术实施例提供了一种处理终端，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式提供的语音降噪方法的步骤。

25、第三方面，本专利技术实施例提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式提供的语音降噪方法的步骤。

26、本专利技术实施例提供一种语音降噪方法、处理终端及存储介质。该方法包括：对当前帧语音数据进行傅里叶变换，得到傅里叶变换频谱；将傅里叶变换频谱输入神经网络模型进行噪声估计得到噪声谱，并根据噪声谱确定各频点的增益系数；根据各个频点的增益系数乘以傅里叶变换频谱，得到降噪后的频谱；对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据。本专利技术实施例中不直接利用神经网络模型进行噪声去除，而仅采用神经网络计算噪声谱，进而根据噪声谱对语音数据进行降噪，降低了计算复杂度，同时对平稳噪声和非平稳噪声均可进行更准确的估计，准确率高。

本文档来自技高网...

【技术保护点】

1.一种语音降噪方法，其特征在于，包括：

2.根据权利要求1所述的语音降噪方法，其特征在于，所述根据所述噪声谱确定各频点的增益系数，包括：

3.根据权利要求2所述的语音降噪方法，其特征在于，所述根据各频点的先验信噪比和后验信噪比，确定各频点的增益系数，包括：

4.根据权利要求3所述的语音降噪方法，其特征在于，所述根据各频点的先验信噪比和后验信噪比，确定各频点语音存在的概率，包括：

5.根据权利要求4所述的语音降噪方法，其特征在于，所述当前帧语音数据的点数为2N；所述当前帧语音数据中的前N个点的数据与上一帧语音数据中的后N个点的数据重合；在所述对所述降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据之后，所述方法还包括：

6.根据权利要求4所述的语音降噪方法，其特征在于，在所述对当前帧语音数据进行傅里叶变换，得到傅里叶变换频谱之前，所述方法还包括：

7.根据权利要求6所述的语音降噪方法，其特征在于，所述当前帧语音数据的点数为2N；所述当前帧语音数据中的前N个点的数据与上一帧语音数据中的后N个点的数据重合；在

8.根据权利要求1至7任一项所述的语音降噪方法，其特征在于，所述神经网络模型为GRU模型、LSTM模型、CNN模型或DNN模型。

9.一种处理终端，其特征在于，包括处理器和存储器，所述存储器用于存储计算机程序，所述处理器用于调用并运行所述存储器中存储的计算机程序，执行如权利要求1至8中任一项所述的语音降噪方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上的权利要求1至8中任一项所述语音降噪方法的步骤。

...

【技术特征摘要】

1.一种语音降噪方法，其特征在于，包括：

2.根据权利要求1所述的语音降噪方法，其特征在于，所述根据所述噪声谱确定各频点的增益系数，包括：

3.根据权利要求2所述的语音降噪方法，其特征在于，所述根据各频点的先验信噪比和后验信噪比，确定各频点的增益系数，包括：

4.根据权利要求3所述的语音降噪方法，其特征在于，所述根据各频点的先验信噪比和后验信噪比，确定各频点语音存在的概率，包括：

5.根据权利要求4所述的语音降噪方法，其特征在于，所述当前帧语音数据的点数为2n；所述当前帧语音数据中的前n个点的数据与上一帧语音数据中的后n个点的数据重合；在所述对所述降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据之后，所述方法还包括：

6.根据权利要求4所述的语音降噪方法，其特征在于，在所述对当前帧语音数据进行傅里叶变换，得到傅里叶变换频谱之前...

【专利技术属性】
技术研发人员：王江，张家源，崔斌，王鑫，
申请(专利权)人：漳州立达信光电子科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人