一种基于小型麦克风阵列的定向语音增强方法技术

技术编号:4168896 阅读:506 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种基于小型麦克风阵列的定向语音增强方法,包括如下步骤:1)利用两个全指向性麦克风采集声音信号;2)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);3)对x(t)和z(t)进行处理分别形成语谱X(ω)和Z(ω);4)根据X(ω)和Z(ω),利用单通道语音增强方法计算出初步增益G′(ω);根据X(ω)和Z(ω),计算出目标信号存在概率P(ω);5)利用所述目标信号存在概率P(ω),对初步增益G′(ω)进行修正,得出最终增益G(ω),G(ω)=(G′(ω))↑[P(ω)]G↓[m]↑[1-P(ω)],其中G↓[m]为预设的增益最小值;6)利用最终增益G(ω),对自适应滤波后的信号z(t)进行增强,得到最终的增强语音信号r(t)。本发明专利技术能够在很小的体积内,实现定向语音增强算法;并且能够获得更大程度的抑制噪声,提高信噪比。

Directional speech enhancement method based on small microphone array

The present invention provides a method for directional speech enhancement based on small microphone array, which comprises the following steps: 1) using two full directional microphone sound signal acquisition; 2) forming algorithm using adaptive valley point, the collected sound signals for data processing, get delayed subtraction signal x (T) and Z signal after the adaptive filter (T); 3) to X (T) and Z (T) are respectively shaped idiom spectrum X (omega) and Z (omega); 4) according to X (omega) and Z (omega), using single channel speech enhancement method to calculate the initial gain of G '(omega) according to X; (W) and Z (omega), calculate the existence probability of P signals (omega); 5) existence probability P using the target signal (omega), the initial gain G' (omega) is modified, finally gain G (omega), G (omega) = (G '(omega)) = P (W) G: m, 1P = (omega), which G m down to a minimum gain preset; 6) the final gain G (omega), the signal after t (Z adaptive filter) enhancement, enhanced the final speech signal R (t). The invention can realize the directional speech enhancement algorithm in a small volume, and can obtain a greater degree of noise suppression and improve the signal to noise ratio.

【技术实现步骤摘要】

本专利技术涉及语音处理
,具体的说,本专利技术特别涉及一种基于麦克风阵列的定向语音增强方法。
技术介绍
语音信号的增强和噪声的消除问题,一直以来都是研究的热点。针对这一问题,已经存在很多基于麦克风阵列的算法,实现加强语音信号,同时抑制干扰(包括各类噪声和其他语音)的效果。麦克风阵列一般体积较大,难以用于在便携式设备(如手机等)。Elko和Luo等人提出和发展了自适应谷点形成算法(Elko and Nguyen,A steerable and variable first-orderdifferential microphone array,ICASSP,1997;Luo,et al.Adaptivenull-forming scheme in digital hearing aids,IEEE Trans.Signal Processing,2002),可以在小尺度阵列上实现定向语音增强,但去噪程度有限。另外,后滤波算法在大尺度阵列上已经得到广泛运用,效果显著。但由于小阵列的麦克风间距有限,噪声相关性较大,基于相关函数的后滤波难以得到运用。
技术实现思路
本专利技术的目的在于克服已有的定向语音增强方法的不足,将自适应谷点形成算法与概率控制的后滤波算法相结合,提出一种适于便携设备的定向语音增强方法,该方法能否在很小的尺度下实现较强的消噪能力,克服了基于相关函数的后滤波器在较小阵列中难以得到应用的缺点。 为实现上述专利技术目的,本专利技术提供的基于小型麦克风阵列的定向语音增强方法,包括如下步骤 1)利用两个全指向性麦克风采集声音信号; 2)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号的语谱X(ω)和自适应滤波后信号的语谱Z(ω); 3)根据X(ω)和Z(ω),利用单通道语音增强方法计算出初步增益G′(ω);根据X(ω)和Z(ω),计算出目标信号存在概率P(ω); 4)利用所述目标信号存在概率P(ω),对初步增益G′(ω)进行修正,得出最终增益G(ω),其中Gm为预设的增益最小值; 5)利用最终增益G(ω),对自适应滤波后的信号z(t)进行增强,得到最终的增强语音信号r(t)。 上述技术方案中,所述步骤2)包括如下子步骤 21)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t); 22)对x(t)和z(t)进行处理分别形成语谱X(ω)和Z(ω)。 上述技术方案中,所述步骤1)中,所述两个麦克风且呈端射式排布,所采集声音信号包括fore(t)和back(t)信号,fore(t)为离说话人较近的麦克风收到的信号,back(t)为离说话人较远的麦克风收到的信号。 上述技术方案中,所述两个麦克风间距d为2cm-5cm。 上述技术方案中,所述步骤21)中,对fore(t)和back(t)进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t); x(t)=fore(t)-back(t-d/c) y(t)=fore(t-d/c)-back(t) 式中,c为声波的传输速度; z(t)是以y(t)做为参考信号,对x(t)进行自适应滤波后得到的信号。 上述技术方案中,所述步骤3)中,所述单通道语音增强方法可采用谱减法,维纳滤波法或EM方法。 上述技术方案中,所述步骤4)中,还包括对G(ω)进行分区间地进一步修正; 式中,Gm为预设的增益最小值,P1是目标信号存在概率的门限值。 上述技术方案中,所述增益最小值Gm取值在0.01-0.1之间,所述目标信号存在概率的门限值P1的取值在0.85-0.95之间。 本专利技术的技术效果包括将自适应谷点形成和概率控制后滤波算法的相结合,在很小的体积内,实现了定向语音增强算法;并且能够获得更大程度的抑制噪声,提高信噪比。概率控制的后滤波算法的主旨是估算出目标信号在各个频率点上是否存在及存在的可能性有多大,藉以决定算法在该频率点上的降噪策略,这种降噪策略特别适合于小尺度的情况。 附图说明 以下,结合附图来详细说明本专利技术的实施例,其中 图1是本专利技术中麦克风摆放和自适应谷点形成示意图; 图2是本专利技术中的概率控制后滤波算法示意图。 具体实施例方式 下面结合附图和具体实施例对本专利技术作进一步地描述。 如图1所示,双麦克风接收到的立体声信号先经过延迟相减,将其结果x(t)和y(t)每32ms作为一帧,计算自适应滤波器系数w(n),其中n为帧序号。如果一帧信号包含的采样点数为L,则自适应滤波器系数可由下式求得 式中α=0.9。 第n帧的滤波结果可计算为 z(nL-L+t)=x(nL-L+t)-W(n)y(nL-L+t) t=0,1,...,L-1 将z(t)和y(t)重新组帧,帧长为32ms,相邻帧重叠50%帧长,第n帧信号分别记作zn(t)和yn(t),对其加窗并进行快速傅立叶变换(即短时傅立叶分析),得第n帧语谱,如图2所示。 STFT[zn(t)]=Zn(ω) STFT[yn(t)]=Yn(ω) 用IMCRA方法(Cohen,Noise spectrum estimation in adverseenvironmentsimproved minima controlled recursive averaging,IEEETrans.Speech and Audio processing)计算出Zn(ω)和Yn(ω)中的噪声分量NnZ(ω)和NnY(ω)。随后通过分析Zn(ω)、Yn(ω)、NnZ(ω)和NnY(ω),计算出初步增益G′n(ω)和目标语音存在概率Pn(ω)(Cohen and Berdugo,Two-channel signaldetection and speech enhancement based on the transientbeam-to-reference ratio,ICASSP 2003)。其中,初步增益G′n(ω)可由各种单通道语音增强方法(如谱减法,维纳滤波法,EM方法等)得到,本实施例中采用EM方法计算初步增益G′n(ω)。目标语音存在概率Pn(ω)表征的是各频点上目标语音成份存在的可能性。本专利技术中利用该目标语音存在概率Pn(ω)对初步增益G′n(ω)进行修正,从而得出用于增强的最终增益。修正方法如下式所示 上式中,Gm为增益的最小值,取值在0.01-0.1之间,P1是存在概率的门限值,取值在0.85-0.95之间。对Gn(ω)的分段处理可以使其取值在合理的区间范围内,减少算法对语音信号产生的失真。 得到最终增益Gn(ω)后,即可对Zn(ω)进行增强,如下式所示 Rn(ω)=Gn(ω)·Zn(ω) 对Rn(ω)做逆傅立叶变换(IFFT),得到该帧的时域信号rn(t)。对照相邻帧的重叠量,进行帧间叠接相加,最终得到增强后的语音信号r(t)。 本专利技术在很小的体积内,实现了定向语音增强算法,很大程度地抑制了噪声,提高了信噪比和听觉舒适度。 为证明本方法的有效性,对同一组带噪语音(两个干扰源,其一为干扰说话人,另一个为音乐,信噪比由-10dB到10dB)进本文档来自技高网...

【技术保护点】
一种基于小型麦克风阵列的定向语音增强方法,包括如下步骤: 1)利用两个全指向性麦克风采集声音信号; 2)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号的语谱X(ω)和自适应滤波后信号的语谱Z(ω);   3)根据X(ω)和Z(ω),利用单通道语音增强方法计算出初步增益G′(ω);根据X(ω)和Z(ω),计算出目标信号存在概率P(ω); 4)利用所述目标信号存在概率P(ω),对初步增益G′(ω)进行修正,得出最终增益G(ω),G(ω )=(G′(ω))↑[P(ω)]G↓[m]↑[1-P(ω)],其中G↓[m]为预设的增益最小值; 5)利用最终增益G(ω),对自适应滤波后的信号z(t)进行增强,得到最终的增强语音信号r(t)。

【技术特征摘要】
1.一种基于小型麦克风阵列的定向语音增强方法,包括如下步骤1)利用两个全指向性麦克风采集声音信号;2)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号的语谱X(ω)和自适应滤波后信号的语谱Z(ω);3)根据X(ω)和Z(ω),利用单通道语音增强方法计算出初步增益G′(ω);根据X(ω)和Z(ω),计算出目标信号存在概率P(ω);4)利用所述目标信号存在概率P(ω),对初步增益G′(ω)进行修正,得出最终增益G(ω),其中Gm为预设的增益最小值;5)利用最终增益G(ω),对自适应滤波后的信号z(t)进行增强,得到最终的增强语音信号r(t)。2.根据权利要求1所述的定向语音增强方法,其特征在于,所述步骤2)包括如下子步骤21)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);22)对x(t)和z(t)进行处理分别形成语谱X(ω)和Z(ω)。3.根据权利要求2所述的定向语音增强方法,其特征在于,所述步骤1)中,所述两个麦克风且呈端射式排布,所采集声音信号包括fore(t)和back(t)信号,fore(t)为...

【专利技术属性】
技术研发人员:颜永红付强张恒
申请(专利权)人:中国科学院声学研究所北京中科信利技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1