一种音频降噪方法和装置制造方法及图纸

技术编号:26306145 阅读:25 留言:0更新日期:2020-11-10 20:04
本发明专利技术实施例公开了一种音频降噪方法和装置,包括获取待处理的预先经过采样处理的原音频信号;将所述原音频信号输入至预先训练的分层扩展网络模型进行计算,得到降噪后的降噪音频信号。本发明专利技术采用分层扩展网络模型,根据输入的音频信号的采样率,帧长的不同进行降噪处理的方法。该方法能够适应不同带宽和复杂度的系统降噪处理,解决了不同采样率,不同的帧长的信号降噪的不灵活性和不易扩展性,针对输入音频信号各种参数的不同进行降噪处理,在提高网络鲁棒性的同时有效保证音频信号的质量。

【技术实现步骤摘要】
一种音频降噪方法和装置
本专利技术实施例涉及音频噪声处理
,具体涉及一种音频降噪方法和装置。
技术介绍
在大多数与音频和语音有关的应用中,例如人机界面、免提通信、IP语音(VoIP)、助听器、电话会议或远程协作系统等等,由麦克风拾取的信号(通常是语音)通常会受到噪声的污染,这些噪音会严重降低语音的质量,从而影响语音应用的效果。因此,麦克风的信号在存储,分析,传输或者播放之前必须进行降噪处理。噪声抑制技术可减少语音信号的稳态和非稳态噪声,从而提高信噪比,改善语音清晰度并减少听力疲劳。传统降噪算法对于低信噪比,非稳态噪声都缺乏有效的解决方法,近年来随着深度学习的发展,神经网络被应用到了各个场景中,例如:语音增强,语音识别,神纹识别,原场语音交互等,研究表明使用深度神经网络能够提高系统对不同环境的鲁棒性。新一代人工智能方法,利用循环神经网络(RNN)对音频信号时序的信息的建模,或者将一维语音信号转为二维语谱图进而采用多层卷积神经网络(CNN)建模,均获得了有效的进展。生成对抗网络作为2017年重大突破,也被应用到语音增强任务。相比较于谱本文档来自技高网...

【技术保护点】
1.一种音频降噪方法,其特征在于,包括:/n获取待处理的预先经过采样处理的原音频信号;/n将所述原音频信号输入至预先训练的分层扩展网络模型进行计算,得到降噪后的降噪音频信号。/n

【技术特征摘要】
1.一种音频降噪方法,其特征在于,包括:
获取待处理的预先经过采样处理的原音频信号;
将所述原音频信号输入至预先训练的分层扩展网络模型进行计算,得到降噪后的降噪音频信号。


2.根据权利要求1所述的方法,其特征在于,所述分层扩展网络模型的训练包括:
获取待训练音频信号;
采用多个预设采样率对所述待训练音频信号进行分频处理,并将进行分频处理后的音频信号输入至与所述采样率对应频带的网络模型进行训练,得到多组分频网络模型的模型参数;
将所述多个分频网络模型的模型参数进行组合,得到分层扩展网络模型。


3.根据权利要求2所述的方法,其特征在于,根据待训练音频信号的帧长,采样率的不同,得到对应的所述频带。


4.根据权利要求2所述的方法,其特征在于,所述将所述多组分频网络模型的模型参数进行组合,包括:
将多组所述模型参数进行叠加组合,或者将低频网络模型的参数作为高频网络模型的输入参数进行组合。


5.根据权利要求2所述的方法,其特征在于,采用基于听觉特性的Mel频率分析技术、Bark域或基于ERB尺度划分技术对所述频带进行划分。


6.一种音频降噪...

【专利技术属性】
技术研发人员:孙学京王松郭红阳
申请(专利权)人:南京拓灵智能科技有限公司北京时代拓灵科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利