一种语音信号增强方法技术

技术编号:28058790 阅读:15 留言:0更新日期:2021-04-14 13:33
本发明专利技术公开了一种语音信号增强方法,其可提高语音存在性判断的准确性,从而提高估计噪声的准确性,同时可有效消除语音信号中的音乐噪声,该方法包括:采集带噪语音信号,带噪语音信号包括的噪声为加性噪声,采用加权叠接相加滤波器组将时域信号转换为频域信号,采用本发明专利技术提出的噪声估计算法对加性噪声信号的功率谱估计值进行更新,采用多子带谱减算法对带噪语音进行功率谱的谱减,得到纯净语音的功率谱估计值,利用带噪语音的相位和纯净语音的幅度谱的估计值,还原纯净语音的频域信号,采用加权叠接相加滤波器组将频域信号重新转换为时域信号,得到语音增强后的纯净语音。得到语音增强后的纯净语音。得到语音增强后的纯净语音。

【技术实现步骤摘要】
一种语音信号增强方法


[0001]本专利技术涉及语音信号处理
,具体为一种语音信号增强方法。

技术介绍

[0002]在语音系统中,噪声往往是最让人讨厌的,因此,语音增强是语音处理系统中最关键的技术之一。语音增强由噪声估计和噪声消除两部分组成。
[0003]传统噪声估计是基于语音存在性的噪声估计,该方法只在无语音段进行噪声估计,仅对平稳噪声有较好的效果,对于非平稳噪声无法实现准确跟踪噪声。基于此,S.Rangachari提出了一个运算量较小,比较适合硬件实现的噪声估计方法,最小值控制的递归平均算法(Minima

Controlled Recursive Averaging, MCRA

2),该方法首先利用最小值跟踪方法实时跟踪噪声,得到一个估计噪声,再利用这个估计噪声判断语音存在概率,基于这个概率计算一个平滑因子,用于时间迭代平均算法,得到新的估计噪声,作为最终的噪声估计。该方法虽然可以跟踪非平稳噪声,但是因为语音存在性判断是根据经验设置的固定的信噪比阈值来判断,在不同背景噪声信噪比下,语音存在性判断准确性会存在差异。
[0004]传统的噪声消除方法包括谱减法,由于对噪声估计过大,导致语音的过减出现负值,经过半波整流后,通常会引入类似水流声的音乐噪声。这种音乐噪声产生主要在于频谱相邻帧剧烈变化而导致某些帧噪声估计过大,对此 Latchman Singh提出多子带谱减,该方法将频谱按频段划分为子带,因为频段相邻帧的变化要比频点相邻帧的变化要平缓,从而降低了音乐噪声。但由于传统实时语音系统一般采用短时傅里叶变换(Short

Time Fourier Transform,STFT) 进行时域

频域转换,帧长大约20~30ms,在这个帧长下,各频段相邻帧的变化还是可能会出现一定程度的剧烈变化,在某些情况下仍会出现音乐噪声。

技术实现思路

[0005]针对现有技术中存在的现有语音噪声消除方法对语音存在性的判断准确性较差,影响语音噪声估计准确性,产生的音乐噪声不易消除的问题,本专利技术提供了一种语音信号增强方法,其可提高语音存在性判断的准确性,从而提高估计噪声的准确性,同时可有效消除语音信号中的音乐噪声。
[0006]为实现上述目的,本专利技术采用如下技术方案:
[0007]一种语音信号增强方法,其特征在于,该方法包括:
[0008]步骤a:采集带噪语音信号y(n),所述带噪语音信号为时域信号,其中,所述带噪语音信号包括的噪声为加性噪声d(n),纯净语音为x(n),n为离散时间。
[0009]步骤b:采用加权叠接相加滤波器组将时域信号转换为频域信号:Y(k)= D(k)+X(k);
[0010]步骤c:采用噪声估计算法对所述加性噪声信号的功率谱估计值进行更新;
[0011]步骤d:采用多子带谱减算法对带噪语音进行功率谱的谱减,得到所述纯净语音的
功率谱估计值
[0012]步骤e:利用所述带噪语音的相位和所述纯净语音的幅度谱的估计值,还原所述纯净语音的频域信号
[0013]步骤f:采用加权叠接相加滤波器组将频域信号重新转换为时域信号,得到语音增强后的纯净语音的估计信号
[0014]其进一步特征在于,步骤c中所述噪声估计算法包括:
[0015]c1:对所述带噪语音信号的带噪语音功率谱进行平滑,得到平滑后的带噪信号的功率谱P(λ,k),λ为离散时间,k为频域子带;
[0016]c2:采用非线性平滑方法跟踪平滑后的所述带噪信号的能量谱最小值,得到最小值跟踪能量谱P
min
(λ,k);
[0017]c3:计算所述带噪语音功率谱与所述最小值跟踪能量谱的比值S
r
(λ,k);
[0018]c4:对所述比值进行平滑,作为判断所述语音存在性的阈值S
th
(λ,k);
[0019]c5:对比c3中所述比值和c4中所述阈值,得到语音存在性信号V(λ,k);
[0020]c6:对所述语音存在性信号进行平滑,获取V
s
(λ,k),防止存在性在0和1 之间突变,导致噪声估计值出现突变,从而引入新的噪声;
[0021]c7:采用平滑后的所述语音存在性信号对所述平滑因子α(λ,k)进行实时更新;
[0022]c8:采用时间迭代方式计算得到噪声功率谱估计值
[0023]步骤d:利用多子带谱减算法对带噪语音进行功率谱的谱减,得到纯净语音的功率谱估计值包括:d1,对各子带进行通道组合,并对各子带的带噪语音幅度谱Y
i
(k)做平滑:
[0024]其中k代表子带,i代表当前子带 k所处的通道;
[0025]d2,在所述带噪语音信号功率谱上对各子带进行谱减,对于噪声估计过大,导致过减的情况,执行半波整流,整流公式如下:
[0026][0027]其中,β为谱下限参数,α
i
和δ
i
分别为各子带的过减因子和减法因子,α
i
和δ
i
的计算公式如下:
[0028][0029][0030]其中,SNR
i
为通道i的信噪比,f
i
为通道i的中心频率,Fs为采样率。
[0031]步骤e:利用所述带噪语音信号y(n)的相位和所述纯净语音的幅度谱的估计值还原所述纯净语音的频域信号
[0032][0033]所述带噪语音信号的采样率为16KHz或32KHz,所述加权叠接相加分析滤波器组和加权叠接相加综合滤波器组的帧长为16或32个点,每一帧的时间为 0.5ms、1ms或2ms。;
[0034]c1中,所述带噪语音功率谱P(λ,k)=α
p
P(λ

1,k)+(1

α
p
)|Y(λ,k)|2[0035]c2中,计算所述最小值跟踪能量谱P
min
(λ,k):
[0036]if P
min


1,k)<P(λ,k)
[0037][0038]else
[0039]P
min
(λ,k)=P(λ,k)
[0040]其中,β
t
为更新系数,γ
t
为平滑系数。
[0041]c3中,所述比值S
r
(λ,k)=P(λ,k)/P
min
(λ,k);
[0042]c4中,所述阈值S
th
(λ,k)=α
s
S
r


1,k)+(1

α
s
)S
r
(λ,k);
[0043]c5中,计算所述语音存在性信号V(λ,k):
[0044][0045]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音信号增强方法,其特征在于,该方法包括:采集带噪语音信号y(n),所述带噪语音信号为时域信号,其中,所述带噪语音信号包括的噪声为加性噪声d(n),纯净语音为x(n),n为离散时间;采用加权叠接相加分析滤波器组将所述时域信号转换为频域信号:Y(k)=D(k)+X(k),其中,D(k)为所述加性噪声的频域信号,X(k)为所述纯净语音的频域信号,k为频域子带;采用噪声估计算法对所述加性噪声信号的功率谱估计值进行更新;采用多子带谱减算法对带噪语音进行功率谱的谱减,得到所述纯净语音的功率谱估计值利用所述带噪语音的相位和所述纯净语音的幅度谱的估计值,还原所述纯净语音的频域信号采用加权叠接相加综合滤波器组将频域信号重新转换为时域信号,得到语音增强后的纯净语音的估计信号2.根据权利要求1所述的一种语音信号增强方法,其特征在于,所述噪声估计算法包括:对所述带噪语音信号的带噪语音功率谱进行平滑,得到平滑后的带噪信号的功率谱P(λ,k),λ为离散时间,k为频域子带;采用非线性平滑方法跟踪平滑后的所述带噪信号的能量谱最小值,得到最小值跟踪能量谱P
min
(λ,k);计算所述带噪语音功率谱与所述最小值跟踪能量谱的比值S
r
(λ,k);对所述比值进行平滑,作为判断所述语音存在性的阈值S
th
(λ,k);对比c3中所述比值和c4中所述阈值,得到语音存在性信号V(λ,k);对所述语音存在性信号进行平滑,获取V
s
(λ,k);采用平滑后的所述语音存在性信号对所述平滑因子α(λ,k)进行实时更新;采用时间迭代方式计算得到噪声功率谱估计值3.根据权利要求2所述的所述一种语音信号增强方法,其特征在于,所述带噪语音功率谱P(λ,k)=α
p
P(λ

1,k)+(1

α
p
)|Y(λ,k)|2;计算所述最小值跟踪能量谱P
min
(λ,k):if P
min


1,k)<P(λ,k)P
min
(λ,k)=P(λ,k)其中,β
t
为更新系数,γ
t
为平滑系数;所述比值S
r<...

【专利技术属性】
技术研发人员:王昂肖宛昂兰玉燕周维新马万康
申请(专利权)人:江苏集萃智能集成电路设计技术研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1