【技术实现步骤摘要】
一种音频降噪方法和装置
本专利技术实施例涉及音频噪声处理
,具体涉及一种音频降噪方法和装置。
技术介绍
在大多数与音频和语音有关的应用中,例如人机界面、免提通信、IP语音(VoIP)、助听器、电话会议或远程协作系统等等,由麦克风拾取的信号(通常是语音)通常会受到噪声的污染,这些噪音会严重降低语音的质量,从而影响语音应用的效果。因此,麦克风的信号在存储,分析,传输或者播放之前必须进行降噪处理。噪声抑制技术可减少语音信号的稳态和非稳态噪声,从而提高信噪比,改善语音清晰度并减少听力疲劳。传统降噪算法对于低信噪比,非稳态噪声都缺乏有效的解决方法,近年来随着深度学习的发展,神经网络被应用到了各个场景中,例如:语音增强,语音识别,神纹识别,原场语音交互等,研究表明使用深度神经网络能够提高系统对不同环境的鲁棒性。新一代人工智能方法,利用循环神经网络(RNN)对音频信号时序的信息的建模,或者将一维语音信号转为二维语谱图进而采用多层卷积神经网络(CNN)建模,均获得了有效的进展。生成对抗网络作为2017年重大突破,也被应用到语音 ...
【技术保护点】
1.一种音频降噪方法,其特征在于,包括:/n获取待处理的预先经过采样处理的原音频信号;/n将所述原音频信号输入至预先训练的分层扩展网络模型进行计算,得到降噪后的降噪音频信号。/n
【技术特征摘要】
1.一种音频降噪方法,其特征在于,包括:
获取待处理的预先经过采样处理的原音频信号;
将所述原音频信号输入至预先训练的分层扩展网络模型进行计算,得到降噪后的降噪音频信号。
2.根据权利要求1所述的方法,其特征在于,所述分层扩展网络模型的训练包括:
获取待训练音频信号;
采用多个预设采样率对所述待训练音频信号进行分频处理,并将进行分频处理后的音频信号输入至与所述采样率对应频带的网络模型进行训练,得到多组分频网络模型的模型参数;
将所述多个分频网络模型的模型参数进行组合,得到分层扩展网络模型。
3.根据权利要求2所述的方法,其特征在于,根据待训练音频信号的帧长,采样率的不同,得到对应的所述频带。
4.根据权利要求2所述的方法,其特征在于,所述将所述多组分频网络模型的模型参数进行组合,包括:
将多组所述模型参数进行叠加组合,或者将低频网络模型的参数作为高频网络模型的输入参数进行组合。
5.根据权利要求2所述的方法,其特征在于,采用基于听觉特性的Mel频率分析技术、Bark域或基于ERB尺度划分技术对所述频带进行划分。
6.一种音频降噪...
【专利技术属性】
技术研发人员:孙学京,王松,郭红阳,
申请(专利权)人:南京拓灵智能科技有限公司,北京时代拓灵科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。