基于双麦克风语音增强装置及方法制造方法及图纸

技术编号:4044001 阅读:211 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种基于双麦克风语音增强装置及方法,该装置包括麦克风阵列模块,包括第一麦克风和第二麦克风,用于接收时域带噪语音信号,并将接收的时域带噪语音信号输出,第一麦克风和第二麦克风接收到时域带噪语音信号分别为x1,x2;固定波束形成器,用于接收所述麦克风阵列模块输出的时域带噪语音信号,并将接收到时域带噪语音信号的语音部分进行叠加,加大该时域带噪语音信号,形成初步加强的语音信号,然后输出。该装置及方法去噪效果良好。

【技术实现步骤摘要】

本专利技术涉及一种。
技术介绍
随着无线通讯的发展,全球移动电话用户越来越多,用户对移动电话的要求已不 仅满足于通话,而且要能够提供高质量的通话效果,尤其是目前移动多媒体技术的发展,移 动电话的通话质量更显重要。由于大量环境噪声的存在,手机等通讯设备的麦克风采集到的语音信号普遍信噪 比不够高,特别是在街道汽车等高噪声环境中,需要提高音量才能使对方听清。所以需要通 过语音增强的方法来提升输入语音的信噪比,改善通讯质量。然而传统的单通道语音增强 方法降噪效果有限,并且会对语音造成较大失真。使用双麦克风阵列,可以引入语音与噪声 信号的相位信息,提高噪声抑制的效果并减小语音的失真。
技术实现思路
本专利技术需解决的技术问题是提供一种去噪效果良好的基于双麦克风语音增强装 置及方法。根据上述需解决的技术问题,本专利技术提供了一种基于双麦克风语音增强装置,该 装置包括麦克风阵列模块,包括第一麦克风和第二麦克风,用于接收时域带噪语音信号,并 将接收的时域带噪语音信号输出,第一麦克风和第二麦克风接收到时域带噪语音信号分别 为 xl,x2 ;固定波束形成器,用于接收所述麦克风阵列模块输出的时域带噪语音信号,并将 接收到时域带噪语音信号的语音部分进行叠加,加大该时域带噪语音信号,形成初步加强 的语音信号,然后输出;阻塞矩阵模块,用于接收所述麦克风阵列模块输出的时域带噪语音信号,将接收 到的上述时域带噪语音信号中的语音部分进行抑制,获得参考噪声信号,然后输出;自适应滤波器,用于接收固定波束形成器输出的初步加强的语音信号和阻塞矩阵 模块输出的参考噪声信号,并进行第一次降噪处理后输出得到初步降噪的信号;语音增强处理模块,用于接收自适应滤波器输出的初步降噪的信号并将该初步降 噪的信号进行语音增强处理,得到进一步加强的语音信号,然后输出;输出模块,用于接收语音增强处理模块输出的进一步加强的语音信号并输出。优选的,所述阻塞矩阵模块满足β· = 0,这里取B = ,将麦克风阵列模块输 出的时域带噪语音信号通过阻塞矩阵B,得到参考噪声信号Ns = X1-X2,其中,B代表阻塞矩 阵,Ns代表参考噪声信号。优选的,第一麦克风和第二麦克风是全指向麦克风。本专利技术还提供了一种基于双麦克风语音增强方法,其特征在于该方法包括如下步6骤步骤S001 由麦克风阵列模块中的第一麦克风和第二麦克风分别接收外界的时 域带噪语音信号xl、x2,并将所述接收到的时域带噪语音信号分别传送给固定波束形成器 和阻塞矩阵模块,由固定波束形成器将得到的第一麦克风和第二麦克风分别接收的时域带 噪语音信号进行放大,得到初步加强的信号yf,由阻塞矩阵模块得到参考噪声信号NS ;步骤S002 将由固定波束形成器得到初步加强的信号^和由阻塞矩阵模块得到 参考噪声信号Ns输入至自适应滤波器,经自适应滤波器的处理得到初步降噪的信号y ;步骤S003 由语音增强处理模块接收自适应滤波器输出的初步降噪的信号,并对 所述初步降噪的信号分为m帧、进行预加重处理,短时傅里叶变换成频域信号Y,并对将频 域信号划分为若干频带k,计算各个频带的能量YE(m,k),其中m表示帧数,k为频带数;设初始的噪声能量估计值V(0,k) = 0,初始的先验信噪比估计值 SNRprior(0,k) = 0;由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频 带当前帧的后验信噪比SNRp。st(m,k),并由前一帧的先验信噪比估计值- 1,A:)得到当前帧的先验信噪比估计值(m, k);采用计权噪声估计法对当前帧的先验信噪比进行修正,得到修正先验信噪比估计 ■》R’prior(m,k、;根据得到的修正先验信噪比估计值5》/ ;^,(叫幻,计算各个频带的衰减增益系数 q (m, k);采用门限判决对所述衰减增益系数进行调整;用得到的调整后的衰减增益系数q' (!!!,⑴,对初步降噪后信号丫&浊)的频谱进 行处理;由修正的先验信噪比估计值5^ ;^(吼幻对当前帧进行判断,判断当前帧是否是噪声;根据噪声判决结果对各频带的噪声能量估计值V(m,k)进行更新,如果判断为噪 声,则噪声能量估计值等于前一帧的值V(m,k) = V(m-1, k),否则采用频带能量YE(m,k), 对噪声能量估计值V(m,k)进行更新;将经上述过程处理后的频域信号变换成时域信号,对该时域信号进行去加重处 理,并输出;步骤S004 将上述经去加重处理的时域信号输出。优选的,步骤S001中,由固定波束形成器对第一麦克风和第二麦克风分别接收外 界的时域带噪语音信号分别经过延时补偿,之后作加权相加得到初步加强的信号,由阻塞 矩阵模块将经过延时补偿的第一麦克风和第二麦克风分别接收外界的时域带噪语音信号 通过阻塞矩阵相加参考噪声信号。优选的,步骤S003中,短时傅里叶变换成频域信号,并对将频域信号划分为若干 频带,计算各个频带的能量;语音增强处理模块对所述初步降噪的信号y进行分帧后的信号为y (m),m表示帧数,经过一个高通滤波器,作为预加重处理,高通滤波器其形式如下H(z) = 1-a其中常数a = 0. 9325,短时傅里叶变换如下2 -2 f—X{f,m) = — X^Hn~m)xx(m)e~ ” 0 ^ kl ^ M"1其中,M为短时傅利叶变换的计算长度,m表示第m帧信号,f表示频率值,X表示 频域信号,x表示时域信号;汉明窗函数定义如下win(n) = {0. 54-0. 46cos (2 * n * n/M)0 彡 n 彡 M_10其余 n}采用如下方法计算每个频带的能量并进行平滑E (m, k) = | X (m,k) |20 ^ k ^ N_1YE(m, k) = a YE(m-l, k) + (l-a )E(m, k)0 彡 k 彡 N_1其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示 当前的子带的序号,a =0.75表示平滑因子;N为选取的频带总数,E(m,k)表示频带能量 值,X(m,k)表示第m帧第k个频带的频域信号;设初始的噪声能量估计值V(0,k) = 0,初始的先验信噪比估计值 SNRprior(0,k) = 0;由各频带的能量\(!11,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各Y {m k)个频带当前帧的后验信噪比^^卿㈣^-^^一并由前一帧的先验信噪比估计值 SNRprior{m- 1,幻得到当前帧的先验信噪比估计值;八\hm-l,k)\2「]SNRprior(m,k) = a——-L + (l-a)max勺丨雄)|}幻表示前一帧最后得到的降噪后语音信号,E{|v(m,k) |2}表示噪声能量估 计值,,a为第一平滑系数;采用计权噪声估计法对先验信噪比估计值进行修正;先验信噪比估计值幻,乘以计权因子去q0,得到正先验信噪比估计值 SNRpnor(m-\,k),计权因子计算如下8 qe =1SNRpri0f{m,k)<yx^—{SNRprior{m,k)-y2)yx<SNRprior{m,k) <6Z Yi-Yi0SNRprior(m,k)>ez其中Y 取 1. 5 左右,Y 2 取 200,9 z 取 20 ;本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:叶利剑
申请(专利权)人:瑞声声学科技深圳有限公司瑞声光电科技常州有限公司
类型:发明
国别省市:94

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1