【技术实现步骤摘要】
一种单通道实时降噪方法及系统
本专利技术属于语音信号处理
,特别涉及一种单通道实时降噪方法及系统。
技术介绍
语音信号是不稳定的,在实际系统中采集时极易受到各种各样的噪声干扰。这些不同类型噪声给语音信号降噪处理带来了巨大的挑战,在过去的数十年里,尝试着用各种噪声谱估计算法去对噪声进行估计,以此来进行语音信号降噪处理。噪声谱的准确估计显得尤为重要,如果对噪声谱估计过低,语音信号中存有残留噪声,如果对噪声谱估计过高,语音信号将会失真、降低可懂度。例如,传统的噪声谱估计方法是基于语音活动检测(VoiceActivityDetector,VAD),这种方法约束了语音缺失段的噪声谱估计更新,而且在弱语音信号、低信噪比情况下很难进行平衡,该方法不适用于非平稳噪声环境;基于直方图的噪声谱估计方法运行时占用内存资源较多,低信噪比情况下噪声谱估计效果较差,在非平稳噪声环境中很难使用。1995年,Doblinger通过连续跟踪每个频率点中有噪语音的最小值来更新噪声估计,这种方法的缺点是无法区分是背景噪声的增大还是语音功率的增大;1995年,Hirsch和Ehrlicher通过比较含噪语音功率和过去噪声谱鼓励来更新噪声谱的估计,该方法实现简单,但当背景噪声突然增大并持续保持在该状态下,此方法无法更新噪声谱的估计;2001年,Martin提出了一种基于最小统计(MinimaStatistics,MS)的噪声谱估计方法,即在一个有限窗口内跟踪平滑含噪语音谱的最小值,并乘以一个偏置补偿因子,以此获得噪声谱的估计,该方法的最大缺陷是当背景噪 ...
【技术保护点】
1.一种单通道实时降噪方法,其特征在于,包括以下步骤:/n步骤1,将单通道采集到的带噪模拟语音信号转换成带噪离散语音信号;/n步骤2,将步骤1获得的带噪离散语音信号进行预处理,获得预处理后的带噪离散语音信号;其中,预处理包括:数据采集时主从时序的产生、数据串并转换、数据缓存、数据预滤波和数据并串转换;/n步骤3,根据步骤1获得的预处理后的带噪离散语音信号中的不同背景噪声,生成算法选择参数;根据所述算法选择参数选择噪声估计方法,通过选择的噪声估计方法对预处理后的带噪离散语音信号进行处理,获得降噪后的时域语音信号;/n步骤4,将步骤3获得的降噪后的时域语音信号,转换为时域和幅值上均连续的信号,完成单通道实时降噪。/n
【技术特征摘要】
1.一种单通道实时降噪方法,其特征在于,包括以下步骤:
步骤1,将单通道采集到的带噪模拟语音信号转换成带噪离散语音信号;
步骤2,将步骤1获得的带噪离散语音信号进行预处理,获得预处理后的带噪离散语音信号;其中,预处理包括:数据采集时主从时序的产生、数据串并转换、数据缓存、数据预滤波和数据并串转换;
步骤3,根据步骤1获得的预处理后的带噪离散语音信号中的不同背景噪声,生成算法选择参数;根据所述算法选择参数选择噪声估计方法,通过选择的噪声估计方法对预处理后的带噪离散语音信号进行处理,获得降噪后的时域语音信号;
步骤4,将步骤3获得的降噪后的时域语音信号,转换为时域和幅值上均连续的信号,完成单通道实时降噪。
2.根据权利要求1所述的一种单通道实时降噪方法,其特征在于,步骤3具体包括:
对预处理后的带噪离散语音信号的信噪比进行了计算,如果所求得的信噪比小于等于1dB,则把对应背景噪声判别成强背景噪声环境,生成参数1;
如果所求得的信噪比大于1dB,则把对应背景噪声判别成其他背景噪声,再根据其统计特性进性区分,所得的统计特性为常数,则把对应背景噪声判别成平稳噪声,生成参数2;如果所得的统计特性不为常数,则把对应背景噪声判别成非平稳噪声,生成参数3;
其中,平稳噪声选择最小值统计方法来估计带噪语音信号中噪声信号,非平稳噪声选择最小控制递归平均方法来估计带噪语音信号中的噪声信号,强背景噪声选择改善的最小控制递归平均方法来估计带噪语音信号中的噪声信号;
所述改善的最小控制递归平均方法包括:存在概率p(k,λ)的计算方式和引入偏差补偿因子。
3.根据权利要求2所述的一种单通道实时降噪方法,其特征在于,步骤3中,
改善的最小控制递归平均方法包括:通过两次迭代运算得出语音信号不存在的概率的值;其中,第一次迭代得出粗略的语音活性判决,第二次迭代利用相邻频点间的强相关性进行时频平滑得出精确的语音存在概率;得到噪声信号的功率谱的估计值表达式为:
式中,β为引入的偏差补偿因子,为是利用递归平均方法得到的噪声信号的功率谱估计,其表达式为:
式中,为当前帧噪声信号的功率谱密度,为上一帧噪声信号的功率谱密度,αd(k,λ)为递归平滑因子,|Y(k,λ)|2为带噪语音信号功率谱,k为频率槽指数,λ为帧号;
最小值统计方法包括:首先对带噪语音信号的功率谱|Y(k,λ)|2进行一阶平滑,得到平滑后的带噪语音功率P(k,λ);其次是在固定的窗长内跟踪P(k,λ)各频带的最小值,得到最小值Pmin(k,λ);最后对得到的最小值Pmin(k,λ)进行偏差补偿,得到噪声信号的功率谱,表达式为:
其中,为最小控制递归平均方法的噪声功率谱无偏估计,Bmin(k,λ)为偏差补偿因子;
最小控制递归平均方法包括:首先,利用一阶平滑对带噪语音信号的功率谱|Y(k,λ)|2进行处理,得到带噪语音信号的平滑功率谱S(k,λ);其次,在固定窗长中搜索得到平滑功率谱的最小值Smin(k,λ);再次,利用平滑功率谱S(k,λ)和平滑功率谱的最小值Smin(k,λ)来计算语音信号存在的概率p(k,λ);再次,利用带噪语音信号中语音信号存在的概率函数p(k,λ)计算递归平均因子αd(k,λ);最后,利用递归平均因子更新噪声功率谱密度的估计值,表达式为:
其中,为当前帧噪声信号的功率谱密度,为上一帧噪声信号的功率谱密度,αd(k,λ)为递归平滑因子,|Y(k,λ)|2为带噪语音信号功率谱,k为频率槽指数,λ为帧号。
4.根据权利要求1所述的一种单通道实时降噪方法,其特征在于,步骤3中,所述通过选择的噪声估计方法对预处理后的带噪离散语音信号进行处理,具体包括:
(1)对预处理后的带噪离散语音信号进行滤波处理,获得滤波后信号;
(2)将步骤(1)获得的滤波后信号进行重叠分帧、加窗;
(3)将步骤(2)重叠分帧、加窗后的语音信号进行傅里叶变换,指定任意信号随时间和频率变化的复数幅度;
(4)对每一帧带噪语音信号进行处理,包括:通过选择的噪声估计方法对带噪语音信号中噪声谱的估计;计算获得衰减因子;将衰减因子用于带噪语音信号中,得到降噪处理后的频域语音信号;
(5)将步骤(4)获得的频域语音信号进行短时傅里叶逆变换,将降噪处理后的语音信号由频域转换到时域,获得离散的语音信号;
(6)加窗、重叠相加将步骤(5)短时傅里叶逆变换后获得的离散的语音信号进行拼接,获得降噪后的时域语音信号。
5.根据权利要求4所述的一种单通道实时降噪方法,其特征在于,包括:
步骤1中,信号模型为:y(t)=x(t)+d(t);其中,x(t)是纯净的语音信号,y(t)是观测到的带噪语音信号,d(t)则是噪声信号;模型中x(t)受到加性噪声d(t)干扰,且带噪语音信号y(t)与纯净的语音信号x(t)不相关;x(t)、d(t)以及y(t)都是模拟信号,在时间域和频率域上均连续,进行A/D采样处理,采样周期为T,采样频率为Fs,T=1/Fs,获得离散的信号y(n),x(n)及d(n),n为正整数,y(n)=x(n)+d(n);
步骤2中,对y(n)进行滤波处理,选用的滤波器是高通滤波器,所述高通滤波器通过最佳一致逼近法设计,用h(n)表示,公式如下:yh(n)=h(n)*y(n),其中,yh(n)滤波后的时域离散信号,*为乘法运算符号;
步骤3的(2)中,所使用的窗函数为Kaiser窗函数,表达式为:w2(N)+w2(M+N...
【专利技术属性】
技术研发人员:陈龙,黄海,隆弢,陈玮,
申请(专利权)人:声耕智能科技西安研究院有限公司,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。