一种基于时频掩蔽平滑策略的单声道噪声抑制方法和装置制造方法及图纸

技术编号:31492523 阅读:22 留言:0更新日期:2021-12-18 12:29
本发明专利技术公开了一种基于时频掩蔽平滑策略的单声道噪声抑制方法和装置,属于信息处理的领域,该方法包括以下步骤:S1:对麦克风的时域信号进行短时傅里叶变换得到时频域表达;S2:进行噪音信号功率谱密度估计,其具体包括:噪音功率谱密度初估计、平稳噪音功率谱密度估计、语音功率谱密度估计以及计算平滑后的噪音功率谱密度;S3:建立维纳型噪音抑制因子,用于区分语音分量和噪音分量;S4:根据维纳型噪音抑制因子,得到目标语音的频域信号,进而获得目标语音时域信号。本发明专利技术可以有效降低语音失真,同时对原掩蔽值的误差可以有效平滑,提高原时频掩蔽估计的泛化性。原时频掩蔽估计的泛化性。原时频掩蔽估计的泛化性。

【技术实现步骤摘要】
一种基于时频掩蔽平滑策略的单声道噪声抑制方法和装置


[0001]本专利技术属于信息处理的领域,具体涉及一种基于时频掩蔽平滑策略的单声道噪声抑制方法和装置。

技术介绍

[0002]在语音会议系统等诸多应用中,麦克风采集的语音信号会被信道噪声和各种背景噪声所干扰。这些平稳噪声,传输到对方网络经过扬声器播放之后,会降低通话系统的通信质量。通过算法来抑制麦克风采集到的噪声信号,同时语音信号失真控制在非常低的水平,是目前通话系统的常规方法。
[0003]现有技术中,为了改善会议系统或者会议设备中语音通讯质量,如何抑制噪声一直是一项关键技术。传统信号处理的方法是追踪信号中的噪音功率谱密度和语音功率谱密度,然后基于维纳滤波在频域构建一个0到1的掩蔽值,对麦克风信号掩蔽之后,达到抑制背景噪声的目的。然而,纯粹采用信号处理的方法,无非有效追踪背景中的非平稳噪声,其次在强背景噪音场景下,有较大的语音失真。随着深度学习技术的发展和成熟,在噪声抑制领域应用也越来越广泛。为了解决传统信号处理方法无法处理非平稳噪声的问题,越来越多基于深度学习的方法被提出来,主要思本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于时频掩蔽平滑策略的单声道噪声抑制方法,其特征在于,包括以下步骤:S1:对麦克风的时域信号进行短时傅里叶变换得到时频域表达;S2:进行噪音信号功率谱密度估计,其具体包括:噪音功率谱密度初估计、平稳噪音功率谱密度估计、语音功率谱密度估计以及计算平滑后的噪音功率谱密度;S3:建立维纳型噪音抑制因子,用于区分语音分量和噪音分量;S4:根据维纳型噪音抑制因子,得到目标语音的频域信号,进而获得目标语音时域信号。2.根据权利要求1所述的基于时频掩蔽平滑策略的单声道噪声抑制方法,其特征在于,所述步骤S1之前还包括:获取麦克风的语音信号x(n);所述步骤S1包括:对时域信号x(n)进行短时傅里叶变换得到时频域表达:3.根据权利要求2所述的基于时频掩蔽平滑策略的单声道噪声抑制方法,其特征在于,所述步骤S2具体包括以下步骤:S201:假设采用深度学习估计的时频掩蔽值为M(l,k),对每一个频带k,计算噪音功率谱密度初估计ρ
v
(k);其中,噪音功率谱密度初估计ρ
v
(k)的计算公式如下:ρ
v
(k)=αρ
v
(k)+(1

α)(1

M(l,k))|X(l,k)|2;S202:估计平稳噪音功率谱密度ρ
min
(k);其中,平稳噪音功率谱密度ρ
min
(k)的计算公式如下:ρ
min
(k)=αρ
min
(k)+(1

α)min(ρ
v
(k),|X(l,k)|2);S203:估计语音功率谱密度ρ
y
(k);其中,语音功率谱密度ρ
y
(k)的计算公式如下:ρ
y
(k)=αρ
y
(k)+(1

α)M(l,k)|X(l,k)|2;S204:计算平滑后的噪音功率谱密度ρ
s
(k);其中,平滑后的噪音功率谱密度ρ
s
(k)的计算公式如下:其中,α为相邻帧间的平滑因子。4.根据权利要求3所述的基于时频掩蔽平滑策略的单声道噪声抑制方法,其特征在于,所述相邻帧间的平滑因子α的取值为0.95。5.根据权利要求3所述的基于时频掩蔽平滑策略的单声道噪声抑制方法,其特征在于,所述维纳型噪音抑制因子G(l,k)的计算公式如下:其中,公式中的第一项为...

【专利技术属性】
技术研发人员:何平蒋升
申请(专利权)人:随锐科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1