应用语音存在概率优化的RETF混响消除方法及系统技术方案

技术编号:14708280 阅读:49 留言:0更新日期:2017-02-26 00:18
本发明专利技术公开应用语音存在概率优化的RETF混响消除方法及系统,其中,方法包括步骤:通过应用语音存在概率对噪声和混响进行估计,得到初步混响消除后的语音信号,进一步应用基于语音存在概率计算的EM增益对所述初步混响消除后的语音信号进行后置滤波,得到最终混响消除的语音信号。通过本发明专利技术不仅能简化系统,提高系统的运行速度,而且极大地改善了混响消除的效果,提升了语音识别的准确率。

【技术实现步骤摘要】

本专利技术涉及语音识别
,尤其涉及应用语音存在概率优化的RETF混响消除方法及系统
技术介绍
随着语音识别技术的广泛使用,产品智能化水平的显著提高,如何让机器更好的听懂人类语言,提高人机交互的流畅性,成为目前人们研究的热点。目前的语音识别系统,只对理想的语音信号识别率较高,对于包含噪声和混响的实时采集语音,识别效果较低。混响是指,在语音采集的过程中,声音在房间中经过墙壁、家具等表面反射,与原始语音一同被麦克风接收得到的信号,在时域和频域范围内由于反射声导致的语音拖尾、混叠现象。目前一种较好的混响消除算法是应用基于相对早期传递函数的波束成形RETF算法,混响的消除能力较强,能否达到3~5米内的远程拾音的效果。但现有的RETF算法需要对信号进行反复的维纳滤波以估算噪声、传递函数和进行后置滤波,该算法存在大量冗余过程并且其应用的后置维纳滤波效果较差的问题。因此,现有技术还有待于改进和发展。
技术实现思路
鉴于上述现有技术的不足,本专利技术的目的在于提供应用语音存在概率优化的RETF混响消除方法及系统,旨在解决现RETF算法存在大量冗余过程并且后置维纳滤波效果较差的问题。本专利技术的技术方案如下:应用语音存在概率优化的RETF混响消除方法,其中,包括步骤:A、采用互相关时延估计算法对各通道语音信号进行延时加权叠加,得到固定波束成形频域系数;B、采用语音存在概率粗估计算法对语音信号进行类型判断,当判断所述语音信号为语音帧时,则不更新噪声功率谱;当判断所述语音信号为噪声帧时,则更新噪声功率谱,并计算所述语音信号的噪声功率及混响功率;C、根据所述噪声功率及混响功率求解相对早期传递函数,并根据所述相对早期传递函数计算混响噪声合成滤波器的阻塞矩阵和自适应矩阵;D、根据所述固定波束成形的频域系数、阻塞矩阵及自适应矩阵计算得到初步混响消除后的语音信号;E、应用语音存在概率优化的EM增益对所述初步混响消除后的语音信号进行后置滤波,得到最终混响消除的语音信号。较佳地,所述的应用语音存在概率优化的RETF混响消除方法,其中,所述步骤A具体包括:A1、以第一帧语音信号x1(n)为基准,应用互相关时延估计算法计算每帧语音信号xi(n)与第一帧语音信号x1(n)之间的互相关函数;A2、根据公式:计算固定波束成形的频域系数h0(k);其中,所述fs对应采样频率,所述τi为所述互相关函数的极大值所在位置对应两帧间的移位距离。较佳地,所述的应用语音存在概率优化的RETF混响消除方法,其中,所述步骤B具体包括:B1、在时域和频域范围内对语音信号的功率谱进行平滑,通过公式:S(k,j)=a*S(k,j-1)+(1-a)Sf(k,j)计算所述语音信号的语音功率谱;其中,所述S(k,j)为所述语音信号第j帧第k频点的语音功率谱,所述a为固定值,所述其中,所述w为窗口范围,所述b(i)为权值,所述Sf(k,j)为频域在窗口范围w内以权值b(i)计算的平均值;B2、通过比较S(k,j)/Smin(k)与δ值的大小对语音信号进行类型判断,当S(k,j)/Smin(k)>δ时,则判断所述语音信号为语音帧,不更新噪声功率谱;当S(k,j)/Smin(k)<δ时,则判断所述语音信号为噪声帧,更新噪声功率谱并计算所述语音信号的噪声功率N(k,j)及混响功率R(k,j);所述Smin(k)为频点k在各语音帧内取值的最小值。较佳地,所述的应用存在概率优化的RETF混响消除方法,其中,所述步骤C具体包括:C1、根据所述噪声功率N(k,j)及混响功率R(k,j)得到所述相对早期传递函数的表达式为:其中,C2、根据所述相对早期传递函数计算得到混响噪声合成滤波器的阻塞矩阵为自适应矩阵为:hNC(k)=(BH(k)*S(k)*B(k))-1*(BH(k)*S(k)*h0(k))。较佳地,所述的应用语音存在概率优化的RETF混响消除方法,其中,所述步骤E具体包括:E1、计算语音信号的各频点语音存在概率:其中,γ(k)为各频点对应的后验信噪比,所述ξ(k)为各频点对应的先验信噪比,Q(k)为概率值;E2、根据所述各频点语音存在概率计算EM增益表达式为:其中,所述GH1(k)为增益系数,所述其中所述Γ为gamma函数,M为合流超几何函数,Gmin(k)=10-1.5;E3、应用所述EM增益表达式对所述初步混响消除后的语音信号进行后置滤波,得到最终混响消除的语音信号。应用语音存在概率优化的RETF混响消除系统,其中,包括:固定波束成形频域系数获取模块,用于采用互相关时延估计算法对各通道语音信号进行延时加权叠加,得到固定波束成形频域系数;噪声功率及混响功率获取模块,用于采用语音存在概率粗估计算法对语音信号进行类型判断,当判断所述语音信号为语音帧时,则不更新噪声功率谱;当判断所述语音信号为噪声帧时,则更新噪声功率谱,并计算所述语音信号的噪声功率及混响功率;阻塞矩阵和自适应矩阵获取模块,用于根据所述噪声功率及混响功率求解相对早期传递函数,并根据所述相对早期传递函数计算混响、噪声合成滤波器的阻塞矩阵和自适应矩阵;初步消除混响模块,用于根据所述固定波束成形的频域系数、阻塞矩阵及自适应矩阵计算得到初步混响消除后的语音信号;后置滤波模块,用于应用语音存在概率优化的EM增益对所述初步混响消除后的语音信号进行后置滤波,得到最终混响消除的语音信号。较佳地,所述的应用语音存在概率优化的RETF混响消除系统,其中,所述固定波束成形频域系数获取模块具体包括:互相关函数获取单元,用于以第一帧语音信号x1(n)为基准,应用互相关时延估计算法计算每帧语音信号xi(n)与第一帧语音信号x1(n)之间的互相关函数;固定波束成形频域系数获取单元,用于根据公式:计算固定波束成形的频域系数h0(k);其中,所述fs对应采样频率,所述τi为所述互相关函数的极大值所在位置对应两帧间的移位距离。较佳地,所述的应用语音存在概率优化的RETF混响消除系统,其中,所述噪声功率及混响功率获取模块具体包括:语音信号的功率谱计算单元,用于在时域和频域范围内对语音信号的功率谱进行平滑,通过公式:S(k,j)=a*S(k,j-1)+(1-a)Sf(k,j)计算所述语音信号的语音功率谱;其中,所述S(k,j)为所述语音信号第j帧第k频点的语音功率谱,所述a为固定值,所述其中,所述w为窗口范围,所述b(i)为权值,所述Sf(k,j)为频域在窗口范围w内以权值b(i)计算的平均值;噪声功率及混响功率获取单元,用于通过比较S(k,j)/Smin(k)与δ值的大小对语音信号进行类型判断,当S(k,j)/Smin(k)>δ时,则判断所述语音信号为语音帧,不更新噪声功率谱;当S(k,j)/Smin(k)<δ时,则判断所述语音信号为噪声帧,更新噪声功率谱并计算所述语音信号的噪声功率N(k,j)及混响功率R(k,j);所述Smin(k)为频点k在各语音帧内取值的最小值。较佳地,所述的应用存在概率优化的RETF混响消除系统,其中,所述阻塞矩阵和自适应矩阵获取模块具体包括:相对早期传递函数计算单元,用于根据所述噪声功率N(k,j)及混响功率R(k,j)得到所述相对早期传递函数的表达式为:其中,所述所述阻塞矩阵和自适应矩阵获取单元,用于根据所述相对早本文档来自技高网...
应用语音存在概率优化的RETF混响消除方法及系统

【技术保护点】
应用语音存在概率优化的RETF混响消除方法,其特征在于,包括步骤:A、采用互相关时延估计算法对各通道语音信号进行延时加权叠加,得到固定波束成形频域系数;B、采用语音存在概率粗估计算法对语音信号进行类型判断,当判断所述语音信号为语音帧时,则不更新噪声功率谱;当判断所述语音信号为噪声帧时,则更新噪声功率谱,并计算所述语音信号的噪声功率及混响功率;C、根据所述噪声功率及混响功率求解相对早期传递函数,并根据所述相对早期传递函数计算混响噪声合成滤波器的阻塞矩阵和自适应矩阵;D、根据所述固定波束成形的频域系数、阻塞矩阵及自适应矩阵计算得到初步混响消除后的语音信号;E、应用语音存在概率优化的EM增益对所述初步混响消除后的语音信号进行后置滤波,得到最终混响消除的语音信号。

【技术特征摘要】
1.应用语音存在概率优化的RETF混响消除方法,其特征在于,包括步骤:A、采用互相关时延估计算法对各通道语音信号进行延时加权叠加,得到固定波束成形频域系数;B、采用语音存在概率粗估计算法对语音信号进行类型判断,当判断所述语音信号为语音帧时,则不更新噪声功率谱;当判断所述语音信号为噪声帧时,则更新噪声功率谱,并计算所述语音信号的噪声功率及混响功率;C、根据所述噪声功率及混响功率求解相对早期传递函数,并根据所述相对早期传递函数计算混响噪声合成滤波器的阻塞矩阵和自适应矩阵;D、根据所述固定波束成形的频域系数、阻塞矩阵及自适应矩阵计算得到初步混响消除后的语音信号;E、应用语音存在概率优化的EM增益对所述初步混响消除后的语音信号进行后置滤波,得到最终混响消除的语音信号。2.根据权利要求1所述的应用语音存在概率优化的RETF混响消除方法,其特征在于,所述步骤A具体包括:A1、以第一帧语音信号x1(n)为基准,应用互相关时延估计算法计算每帧语音信号xi(n)与第一帧语音信号x1(n)之间的互相关函数;A2、根据公式:计算固定波束成形的频域系数h0(k);其中,所述fs对应采样频率,所述τi为所述互相关函数的极大值所在位置对应两帧间的移位距离。3.根据权利要求1所述的应用语音存在概率优化的RETF混响消除方法,其特征在于,所述步骤B具体包括:B1、在时域和频域范围内对语音信号的功率谱进行平滑,通过公式:S(k,j)=a*S(k,j-1)+(1-a)Sf(k,j)计算所述语音信号的语音功率谱;其中,所述S(k,j)为所述语音信号第j帧第k频点的语音功率谱,所述a为固定值,所述其中,所述w为窗口范围,所述b(i)为权值,所述Sf(k,j)为频域在窗口范围w内以权值b(i)计算的平均值;B2、通过比较S(k,j)/Smin(k)与δ值的大小对语音信号进行类型判断,当S(k,j)/Smin(k)>δ时,则判断所述语音信号为语音帧,不更新噪声功率谱;当S(k,j)/Smin(k)<δ时,则判断所述语音信号为噪声帧,更新噪声功率谱并计算所述语音信号的噪声功率N(k,j)及混响功率R(k,j);所述Smin(k)为频点k在各语音帧内取值的最小值。4.根据权利要求1所述的应用存在概率优化的RETF混响消除方法,其特征在于,所述步骤C具体包括:C1、根据所述噪声功率N(k,j)及混响功率R(k,j)得到所述相对早期传递函数的表达式为:其中,C2、根据所述相对早期传递函数计算得到混响噪声合成滤波器的阻塞矩阵为自适应矩阵为:hNC(k)=(BH(k)*S(k)*B(k))-1*(BH(k)*S(k)*h0(k))。5.根据权利要求1所述的应用语音存在概率优化的RETF混响消除方法,其特征在于,所述步骤E具体包括:E1、计算语音信号的各频点语音存在概率:其中,γ(k)为各频点对应的后验信噪比,所述ξ(k)为各频点对应的先验信噪比,Q(k)为概率值;E2、根据所述各频点语音存在概率计算EM增益表达式为:其中,所述GH1(k)为增益系数,所述其中所述Γ为gamma函数,M为合流超几何函数,Gmin(k)=10-1.5;E3、应用所述EM增益表达式对所述初步混响消除后的语音信号进行后置滤波,得到最终混响消除的语音信号。6.应用语音存在概率优化的RETF混响消除系统,其特征在于,包括:固定波束成形频域系数获取模块,用于采用互相关时延估计算法对各通道语音信号进行延时加权叠加,得到固定波束成形频域系数;噪声功率及混响功...

【专利技术属性】
技术研发人员:李敬源
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1