一种基于深度学习的音频降噪方法及系统技术方案

技术编号：39307314 阅读：12 留言：0更新日期：2023-11-12 15:55

本发明专利技术公开了一种基于深度学习的音频降噪方法及系统，包括以下步骤：采集包含噪声的音频，构建最优音频模型并获取采集音频的音频特征，对所述采集音频的音频特征进行深度学习，提取人声音频和噪声音频，根据所述噪声音频，获取反相噪声音频并进行合并输出。音频处理设备对噪声音频进行实时音量分析，并对音频处理设备的降噪程度进行自适应调控。本发明专利技术能够通过音频处理设备对降噪音频的深度学习，来进行音频的实时降噪，保护音频处理设备用户的身体健康，并使降噪效果更完美。并使降噪效果更完美。并使降噪效果更完美。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的音频降噪方法及系统

[0001]本专利技术涉及音频降噪领域，特别是一种基于深度学习的音频降噪方法及系统。

技术介绍

[0002]在生活中，有多个地方需要用到音频降噪，例如降噪耳机、降噪麦克风、降噪音响等。对输入音频进行降噪目的是使目标音频能更清晰的输出，同时降低噪音有利于音频处理设备使用者的身体健康，保护音频处理设备使用者不被噪声音频影响。深度学习模型能够对采集的音频进行深度学习，获取需要降噪的音频部分，并对对应的音频进行处理，最大程度的输出目标音频及降低噪声音频。所以提出一种基于深度学习的音频降噪方法及系统，用于对音频进行降噪。

技术实现思路

[0003]本专利技术克服了现有技术的不足，提供了一种基于深度学习的音频降噪方法及系统。
[0004]为达到上述目的，本专利技术采用的技术方案为：本专利技术第一方面提供了一种基于深度学习的音频降噪方法，包括以下步骤：采集包含噪声的音频，构建最优音频模型，分析所述最优音频模型，获取采集音频的音频特征；基于采集音频的音频特征，对采集音频进行深度学习，并提取采集音频中的所需的人声音频；对噪声音频进行分析，获取反相噪声音频，并将所述反相噪声音频与噪声音频进行合并输出；音频处理设备对噪声音频进行实时音量分析，并对音频处理设备的降噪程度进行自适应调控。
[0005]进一步的，本专利技术的一个较佳实施例中，所述采集包含噪声的音频，构建最优音频模型，分析所述最优音频模型，获取采集音频的音频特征，具体为：通过音频处理设备，实时采集包含噪声的音频...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的音频降噪方法，其特征在于，包括以下步骤：采集包含噪声的音频，构建最优音频模型，分析所述最优音频模型，获取采集音频的音频特征；基于采集音频的音频特征，对采集音频进行深度学习，并提取采集音频中的所需的人声音频；对噪声音频进行分析，获取反相噪声音频，并将所述反相噪声音频与噪声音频进行合并输出；音频处理设备对噪声音频进行实时音量分析，并对音频处理设备的降噪程度进行自适应调控。2.根据权利要求1中所述的一种基于深度学习的音频降噪方法，其特征在于，所述采集包含噪声的音频，构建最优音频模型，分析所述最优音频模型，获取采集音频的音频特征，具体为：通过音频处理设备，实时采集包含噪声的音频，定义为采集音频，在所述音频处理设备中构建音频存储库，将采集音频存储至所述音频存储库中；将采集音频进行切分和标记，并进行音频数据预处理，所述音频数据预处理包括对采集音频进行采样率调整和归一化处理；将进行音频数据预处理后的采集音频导入至信号处理工具中进行傅里叶变换，转化为采集音频频域，对所述采集音频频域进行分析，获取采集音频频域的时域特性和能量分布特性；获取采集音频所处环境的环境参数，基于大数据网络检索，获取所有的音频模型样本，将所有的音频模型样本与采集音频所处环境的环境参数进行对照分析，得到对照分析重合度最高的音频模型样本，定义为最优音频模型；将所述采集音频频域的时域特性和能量分布特性导入最优音频模型中进行模型训练，得到训练后的最优音频模型；基于最大似然法，获取训练后的最优音频模型的模型参数，所述模型参数为采集音频的音频特征。3.根据权利要求1中所述的一种基于深度学习的音频降噪方法，其特征在于，所述基于采集音频的音频特征，对采集音频进行深度学习，并提取采集音频中的所需的人声音频，具体为：将所述采集音频的音频特征导入深度神经网络模型中，对深度神经网络模型的权重及偏置参数进行初始化处理，并选择交叉熵函数作为深度神经网络模型的损失函数；基于随机梯度下降法，对深度神经网络模型的网络参数进行更新，基于更新后的网络参数，最小化交叉熵函数；基于最小化后的交叉熵函数，对深度神经网络模型进行反向训练，得到训练结果，在反向训练过程中，获取训练过程中的超参数，基于训练结果，并对超参数进行调整，得到训练好的深度学习模型；将所述采集音频导入训练好的深度学习模型中进行音频初步分离，得到初步人声音频和初步噪声音频；获取初步人声音频和初步噪声音频的信噪比，并预设标准信噪比，若初步人声音频和
初步噪声音频的信噪比小于标准信噪比，则基于小波分解法，使用小波基函数将所述初步人声音频和初步噪声音频进行多次分解，得到多组近似函数和细节函数，在每次分解后保留细节函数，并通过逆小波变换将细节函数重新合并，得到人声音频和噪声音频；若初步人声音频和初步噪声音频的信噪比在标准信噪比阈值内，则将初步人声音频和初步噪声音频直接输出，得到人声音频和噪声音频。4.根据权利要求1中所述的一种基于深度学习的音频降噪方法，其特征在于，所述对噪声音频进行分析，获取反相噪声音频，并将所述反相噪声音频与噪声音频进行合并输出，具体为：对采集音频频域的时域特性和能量分布特性进行分析及特征提取，获取噪声音频的时域特性和能量分布特性；基于所述噪声音频的时域特性和能量分布特性，在自适应滤波器中，获取自适应滤波器的权重系数；基于最小化均方误差法，对自适应滤波器的权重系数进行调整训练，并将所述噪声音频分成多个噪声音频样本；训练后的自适应滤波器逐个对噪声音频样本进行分析和取反处理，生成反相噪声音频样本，将多...

【专利技术属性】
技术研发人员：黄洪平，邓胜丰，白启昊，
申请(专利权)人：深圳市齐奥通信技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人