一种基于迭代维纳滤波的助听器多通道语音增强算法制造技术

技术编号:21515767 阅读:38 留言:0更新日期:2019-07-03 09:31
本发明专利技术公开一种基于迭代维纳滤波的助听器多通道语音增强算法,算法步骤为:将带噪信号分成多帧;对每一帧带噪信号进行噪声估计;计算后验信噪比;由后验信噪比估计出先验信噪比;由先验信噪比计算出降噪所需要的降噪衰减增益;降噪衰减增益作用于带噪信号得到增强语音信号;使用得到的增强语音信号作为给定的增强语音,继续对下一帧语音信号重复前面步骤。本发明专利技术提供的语音增强算法具有算法复杂度低、降噪效果好、在保证听力补偿的同时能提升助听器佩戴者的言语识别能力的优点。

A Multichannel Speech Enhancement Method for Hearing Aid Based on Iterative Wiener Filtering

【技术实现步骤摘要】
一种基于迭代维纳滤波的助听器多通道语音增强算法
本专利技术涉及助听器语音增强算法设计领域,具体地讲,涉及一种基于迭代维纳滤波的助听器多通道语音增强算法。
技术介绍
在助听器发展的漫长历史中,为了提高语音理解度和聆听舒适度,所研发的各种降噪技术大体上可以归结为两类:方向性传声和语音增强算法。前者是基于语音和噪声在空间上的差异性设计,利用方向性传声器或多麦克风阵列的波束形成技术来增强特定方向上的语音信号;后者则是旨在利用语音和噪声在时间和频谱上的差异性,将语音从带噪信号中分离出来并且对背景噪声进行衰减从而达到增强语音的目的。目前,常用的语音增强算法主要有谱减法、维纳滤波法、子空间法、听觉掩蔽法等。谱减法虽然实现简单,但容易产生音乐噪声;子空间法的计算量大;而维纳滤波算法则是采用短时谱估计算法来削弱通道中的噪声信号,是比较常规及主流的语音增强方法,实现方式也比较成熟。但是,传统的基于维纳滤波的语音增强算法若要直接应用于助听器,还是存在着诸多限制的,比如,(1)、助听器本身体积小、功耗低,因此处理器芯片的计算速度比起通用处理器芯片要慢很多;(2)、助听器的应用环境下对延时的要求非常高,通常不得多于10ms;(3)、助听器一般需采用多通道分频放大压缩处理,原有算法架构对降噪算法的兼容性要求也很高。综合以上原因,有必要设计一种算法复杂度低、不增加额外时延且降噪性能好的用于助听器中的语音增强算法。
技术实现思路
本专利技术的目的在于克服现有技术中存在的上述不足,而提供一种算法复杂度低、降噪效果好、在保证听力补偿的同时能提升助听器佩戴者的言语识别能力的基于迭代维纳滤波的助听器多通道语音增强算法。本专利技术解决上述问题所采用的技术方案是:一种基于迭代维纳滤波的助听器多通道语音增强算法,其特征在于:步骤如下:步骤一:初始化:将带噪语音信号x(n)分解为M帧,帧长为n(由实际情况取值),每一帧语音带噪信号序列用xi(n)表示;步骤二:在第i次迭代中(i=0,1,2,…M),对于给定的第i帧语音信号xi(n)进行噪声估计;xi(n)经频段解析模块分成多频率段信号成分,然后对各频率段信号进行噪声功率谱估计,具体步骤为:(1)计算各频率段信号的实时功率谱P(i,k),其中i为帧数,k为频点;(2)对实时功率谱进行时间平滑处理:Ps(i,,k)=αPs(i-1,k)+(1-α)P(i,k)其中,Ps(i,k)为平滑后的第i帧、k频点的语音信号功率谱;α为平滑系数;(3)跟踪各频率段信号的功率谱的最小值,进行最小值统计:其中,γ和β为经验系数;(4)由预估的信号功率与噪声功率的比值来决定通道内是否存在语音:其中,δ为门限值;(5)通过I(i,k)更新频率段内语音出现的概率p(i,k):p(i,k)=τp(i-1,k)+(1-τ)I(i,k)其中,τ为概率更新系数;(6)估计频段内噪声功率谱:其中,为更新后的噪声功率谱,η为加权因子(0<η<1);步骤三:计算后验信噪比:其中,为第i帧、k频点的语音信号的后验信噪比,为了避免分母为0,中的ξ0通常会选用一个小的常数值,例如1e-10;步骤四:由后验信噪比估计出先验信噪比:其中,为第i帧、k频点的语音信号的先验信噪比,a为噪音衰减程度系数(0<a<1),G(i-1,k)为第i-1帧、k频点所使用的降噪衰减增益,为对后验信噪比估计值进行的直接判决算法处理,ξmin为先验信噪比估计值所允许的最小值,用来控制降噪程度,ξmin越小,降噪程度越高,语音信号失真度也越高;步骤五:由先验信噪比计算出降噪所需要的降噪衰减增益,理论情况下,言语信号段的G(i,k)接近于1,噪声信号段的G(i,k)接近于0:步骤六:将步骤五得到的增益作用于增强语音xi(n)得到增强语音xi′(n):x′i(n)=G(i,k)xi(n)步骤七:使用xi′(n)作为给定的增强语音,继续对下一帧语音信号重复步骤二至步骤六,迭代会保持一直进行直至语音增强处理关闭。优选的,本专利技术所述步骤二第(2)步中平滑系数α的取值范围为0<α<1。优选的,本专利技术所述步骤二第(3)步中经验系数γ和β的取值范围为0<γ<1,0<β<1。优选的,本专利技术所述步骤二第(4)步中门限值δ的取值范围为δ>0。优选的,本专利技术所述步骤二第(5)步中概率更新系数τ的取值范围为0<τ<1。优选的,本专利技术所述步骤三中概率更新系数ξ0的取值范围为1e-12<ξ0<1e-9。优选的,本专利技术所述步骤四中噪音衰减程度系数a的取值范围为0<a<1,先验信噪比估计值的最小值ξmin的取值范围通常为为-30dB≤ξmin≤0dB。本专利技术与现有技术相比,具有以下优点和效果:本专利技术所述的语音增强算法应用于助听器多通道语音处理的算法结构中,其智能化降噪处理主要是利用统计模型对噪声功率进行估计来达到保持言语声、衰减环境噪声的目的,帮助听障人士在嘈杂环境下使用助听器更好地进行语言交流。附图说明图1是本专利技术实施例语音增强算法结构图。图2是集成有本专利技术实施例语音增强算法的助听器多通道语音处理算法结构图。图3是本专利技术实施例中串行分布式计算方法的流程图。图4是本专利技术实施例中用来进行仿真实验的一段带噪语音信号的录音的波形图。图5是图4中带噪语音信号在MATLAB中的波形图。图6是本专利技术实施例中带噪语音信号的第三个频段(中心频率为1000Hz)的实时功率谱P和平滑后的功率谱Ps的曲线图。图7是本专利技术实施例中带噪语音信号的噪声功率谱曲线图。图8是本专利技术实施例中计算出的增益的变化曲线图。图9是本专利技术实施例语音增强算法应用于实际的助听器系统中,助听器处理后的信号与原信号进行对比的波形图。图10是图9的频域分析图。具体实施方式下面结合附图并通过实施例对本专利技术作进一步的详细说明,以下实施例是对本专利技术的解释而本专利技术并不局限于以下实施例。实施例。参见图1至图10。本实施例为一种基于迭代维纳滤波的助听器多通道语音增强算法,应用于助听器多通道语音处理的算法结构中,助听器多通道语音处理的算法结构参见附图2,其原理为:麦克风接收到的信号经A/D转换器被转换成数字信号后,经过频段解析模块分成多频率段信号成分,其中解析模块的实质是利用多个滤波器分离出不同频率成分的信号,其具体实现方法可视实际应用情况从WOLA滤波器组、频域FFT变换、时域FIR或IIR滤波器组以及加窗等多种方法中选用,需注意的是,转换为模拟信号前各频段处理后的信号在频段合成模块也要选择相对应的逆变换以合成最后的处理后信号;语音信号被解析到不同频段之后,各通道信号成分都经过功率计算单元计算出相应的实时功率以供之后的压缩放大处理及语音增强处理单元来计算所需要提供的增益,每个通道都是经过按照相同的顺序独立完成处理,各个通道对语音信号处理完成后经频段合成模块进行合成,然后经D/A转换器转换成模拟信号后被受话器接受。本实施例中,基于迭代维纳滤波的助听器多通道语音增强算法是用于上述助听器多通道语音处理的算法结构中的语音增强处理单元中,利用统计模型对噪声功率进行估计来达到保持言语声、衰减环境噪声的目的。本实施例中,基于迭代维纳滤波的助听器多通道语音增强算法的步骤如下:步骤一:初本文档来自技高网...

【技术保护点】
1.一种基于迭代维纳滤波的助听器多通道语音增强算法,其特征在于:步骤如下:步骤一:初始化:将带噪语音信号x(n)分解为M帧,帧长为n(由实际情况取值),每一帧语音带噪信号序列用xi(n)表示;步骤二:在第i次迭代中(i=0,1,2,…M),对于给定的第i帧语音信号xi(n)进行噪声估计;xi(n)经频段解析模块分成多频率段信号成分,然后对各频率段信号进行噪声功率谱估计,具体步骤为:(1)计算各频率段信号的实时功率谱P(i,k),其中i为帧数,k为频点;(2)对实时功率谱进行时间平滑处理:Ps(i,k)=αPs(i‑1,k)+(1‑α)P(i,k)其中,Ps(i,k)为平滑后的第i帧、k频点的语音信号功率谱;α为平滑系数;(3)跟踪各频率段信号的功率谱的最小值,进行最小值统计:

【技术特征摘要】
1.一种基于迭代维纳滤波的助听器多通道语音增强算法,其特征在于:步骤如下:步骤一:初始化:将带噪语音信号x(n)分解为M帧,帧长为n(由实际情况取值),每一帧语音带噪信号序列用xi(n)表示;步骤二:在第i次迭代中(i=0,1,2,…M),对于给定的第i帧语音信号xi(n)进行噪声估计;xi(n)经频段解析模块分成多频率段信号成分,然后对各频率段信号进行噪声功率谱估计,具体步骤为:(1)计算各频率段信号的实时功率谱P(i,k),其中i为帧数,k为频点;(2)对实时功率谱进行时间平滑处理:Ps(i,k)=αPs(i-1,k)+(1-α)P(i,k)其中,Ps(i,k)为平滑后的第i帧、k频点的语音信号功率谱;α为平滑系数;(3)跟踪各频率段信号的功率谱的最小值,进行最小值统计:其中,γ和β为经验系数;(4)由预估的信号功率与噪声功率的比值来决定通道内是否存在语音:其中,δ为门限值;(5)通过I(i,k)更新频率段内语音出现的概率p(i,k):p(i,k)=τp(i-1,k)+(1-τ)I(i,k)其中,τ为概率更新系数;(6)估计频段内噪声功率谱:其中,为更新后的噪声功率谱,η为加权因子(0<η<1);步骤三:计算后验信噪比:其中,为第i帧、k频点的语音信号的后验信噪比;步骤四:由后验信噪比估计出先验信噪比:其中,为第i帧、k频点的语音信号的先验信噪比,a为噪音衰减程度系数(0<a<1),G(i-1,k)为第i-1帧、k频点所使用的降噪衰减增益,为对后验信噪比估计值进行的直接判决算法处理,ξmin为先验信噪比估计值所...

【专利技术属性】
技术研发人员:凃磊
申请(专利权)人:杭州惠耳听力技术设备有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1