基于指定带宽的定向噪音抑制方法技术

技术编号:15106103 阅读:80 留言:0更新日期:2017-04-08 16:45
本发明专利技术公开了一种基于指定带宽的定向噪音抑制方法,具体包括:步骤1、根据传输通道的功率谱的期望评价值估计目标语音通道传输函数;步骤2、估计及抑制平稳噪音分量;定义一语音阻塞滤波器,阻塞掉目标语音,得到平稳噪音分量,并计算抑制掉平稳噪音之后的目标语音谱;步骤3、定向噪音抑制;判断目标语音和所观测语音之间的相位差,如果当前时频单元的所观测语音为定向噪音主导,使用带通滤波器将其过滤;最后可得到抑制了平稳噪音和定向噪音的目标语音信号。本发明专利技术系统简单,且在抑制噪音的过程中有效区分了定向噪声和平稳噪声分量的不同,并基于这二者性质上不同,采用不同的方法进行抑制,噪音抑制效果更好。有很高的实用性。

【技术实现步骤摘要】

本专利技术涉及语音信号的噪音抑制方法,具体涉及一种基于指定带宽的定向噪音抑制方法
技术介绍
有关定向噪音和非定向噪音:智能语音相关信号采集设备在采集用户语音的同时通常会被各种各样的噪音干扰。从噪音的来源可以分为定向噪音和非定向噪音两种类型。所谓定向噪音是由一个独立声源所产生,相对于采集终端麦克风阵列方向固定,在信号处理领域通常抽象为一个点源信号。比如在家居环境下电视机的声音、闹钟的声音等等。非定向噪音是指多个能量相差不多的噪音源同时发出噪音,并且这些噪音源相对于麦克风阵列方向并不固定。比如马路上、咖啡厅等等环境噪音。有关噪音抑制:由于噪音的存在会对听觉感知、后续语音识别造成极大的干扰,噪音抑制技术的目的就是把采集到的信号中掺杂的噪音基于语音或者噪音独有的特征给抑制掉,同时尽可能保证目标语音不失真。和非定向噪音相比,定向噪音一般能量较大,比如在智能电视应用中,电视机音箱发出的声音能量要远高于环境噪音,甚至会高于目标语音信号。因此,如果该定向噪音不能被抑制,降会对后续的语音识别造成极大的干扰。定向噪音的另外一个特点是能量随时间快速变化,平稳性非常差。比如各种音乐信号能量起伏非常快,实时追踪、估计噪音在每一时间帧的能量将非常困难,采用常规的估计噪音能量的方法不再有效。噪音抑制要满足智能交互的实时性,不然用户交互体验度会很差。一方面,计算复杂度不能太高。另一方面,噪音抑制对历史信息依赖不能过长,一次处理的缓冲区不能太大。通过短时傅里叶变换技术,把时域信号映射到时频域是降低复杂度、提高实时性的常用技。目前,噪音抑制是智能语音交互系统的前端核心处理模块,由于智能语音交互近几年才在产业界有了广泛影响,现有噪音抑制尤其是定向噪音抑制技术,还存在如下几个问题:1)现有技术依赖于声源方位信息,假设用户方位已知,影响了实用性,因为实际的使用过程中,不可能预先固定用户的声音方位。由于声源相对于麦克风方向信息是基于麦克风阵列的核心线索信息,现有的大部分噪音抑制技术,或者先采用声源定位技术对声源方位信息进行估计,或者对用户方位进行限定。在双麦克风降噪系统领域,由于麦克风数量不多,声源定位算法很难达到很高的精度,自然影响了后续的噪音抑制的效果。而对用户方位进行限定,比如假设用户在麦阵的正前方呈90度,固然提供了精确的方位信息,但是显著了用户使用的自由度,用户体验差。2)现有技术中的噪音抑制模型假设过于理想,或者基于无混响模型,或者混响很小。现有许多噪音抑制技术随着混响的增大性能迅速下降,而实际诸如家居应用环境下,来自墙壁反射的混响会降低方位信息的准确性。另一方面,硬件系统附带的噪音不论对估计目标语音方位还是定向噪音的方位都有重大影响。因此,降噪模型应该有着很高的鲁棒性,以应对应用环境与理想假设的不匹配。3)在现有技术中,也有其他的技术手段可使噪音得到一定程度抑制,但是引入了过高的语音扭曲,更不利于后续的语音识别。从整体来看,大部分噪音抑制技术都可以一定程度上抑制噪音,然后从时频谱图上聚焦到某一个时频单元,会有许多单元因为噪音估计的不准确,能量被过分的抑制,导致语音能量也被错误的扭曲。从语音识别的角度来讲,语音能量的扭曲比噪音的影响更大。因此,许多噪音抑制技术并不能提高语音识别的准确性,甚至会导致识别率下降。
技术实现思路
针对现有技术的不足,本专利技术公开了基于指定带宽的定向噪音抑制方法。本专利技术的技术方案如下:一种基于指定带宽的定向噪音抑制方法,包括双麦克风语音采集模型,所述双麦克风语音采集模型所观测到的语音信号均可分为两个信号通道;双麦克风语音采集模型所观测到的语音信号包括目标语音信号和噪音信号;所述噪音信号包括与目标语音信号方向不一致的定向噪音和非定向的平稳噪音;设置一帧时间帧ls>1,在时间帧l满足1≤l≤ls时,所观测到的语音信号包括目标语音信号和平稳噪音信号;在时间帧l满足l≥ls时,所观测到的语音信号包括目标语音信号、平稳噪音信号和定向噪音信号;所述抑制方法的步骤为:步骤1、估计目标语音通道传输函数;在时间帧l满足1≤l≤ls时,在频域上计算每一个频带k的第一通道的自相关功率谱的期望平均值ρ11(k)、互相关功率谱的期望平均值ρ21(k)、自相关功率谱系数的期望平均值Ω1(k)、互相关功率谱系数的期望平均值Ω2(k);并根据下式估计目标语音通道传输函数:R(k)=Ω2(k)-ρ11(k)ρ21(k)Ω1(k)-ρ11(k)ρ11(k);]]>步骤2、估计及抑制平稳噪音;定义语音阻塞滤波器J(k):J(k)=[-R*(k),1]T;在时间帧l满足1≤l≤ls时,在每一个频带k,利用语音阻塞滤波器,阻塞掉目标语音,得到平稳噪音分量;在时间帧l满足1≤l≤ls时,在频域上计算每一个频带k的平稳噪音的功率谱密度PN,i(k);根据所观测语音谱Zi(l,k)和平稳噪音的功率谱密度PN,i(k),计算抑制掉平稳噪音之后的目标语音谱;步骤3、抑制定向噪音;在时间帧l满足l>ls时,继续抑制平稳噪音,且开始定向噪音抑制过程;目标语音和定向噪音来自不同的方向,根据步骤1的目标语音通道传输函数,目标语音的方向θ(k)为:θ(k)=∠R(k)/kω0;设定一带通滤波器,所述带通滤波器的通带为Δθp(k)、阻带为Δθs(k);判断目标语音和所观测语音之间的相位差,在当前时间帧,如果目标语音和所观测语音之间的相位差在通带Δθp(k)之内,则所观测语音信号为目标语音所主导,如果目标语音和所观测语音之间的相位差在阻带Δθs(k)之内,则所观测语音为定向噪音主导,使用带通滤波器将其过滤;最后可得到抑制了平稳噪音和定向噪音的目标语音信号。其进一步的技术方案为,所述步骤1具体包括:步骤1-1、设置用于储存信息的缓冲区,缓冲区可储存时间帧l满足1≤l≤ls时的语音信息;将观测信号z1(t)和z2(t)写入缓冲区;在时域上,观测信号z1(t)和z2(t)表示为:z1(t)=hS,1(t)*s(t)+n1(t)z2(t)=hS,2(t)*s(t)+n2(t)(1)式(1)中,s(t)为目标语音的时域信号,n1(t)和n2(t)分别为两路不相关的平稳噪音的时域信号,hS,1(t)和hS,2(t)分别代表目标语音到两个麦克风本文档来自技高网
...

【技术保护点】
一种基于指定带宽的定向噪音抑制方法,其特征在于:包括双麦克风语音采集模型,所述双麦克风语音采集模型所观测到的语音信号均可分为两个信号通道;双麦克风语音采集模型所观测到的语音信号包括目标语音信号和噪音信号;所述噪音信号包括与目标语音信号方向不一致的定向噪音和非定向的平稳噪音;设置一帧时间帧ls>1,在时间帧l满足1≤l≤ls时,所观测到的语音信号包括目标语音信号和平稳噪音信号;在时间帧l满足l≥ls时,所观测到的语音信号包括目标语音信号、平稳噪音信号和定向噪音信号;所述抑制方法的步骤为:步骤1、估计目标语音通道传输函数;在时间帧l满足1≤l≤ls时,在频域上计算每一个频带k的第一通道的自相关功率谱的期望平均值ρ11(k)、互相关功率谱的期望平均值ρ21(k)、自相关功率谱系数的期望平均值Ω1(k)、互相关功率谱系数的期望平均值Ω2(k);并根据下式估计目标语音通道传输函数:R(k)=Ω2(k)-ρ11(k)ρ21(k)Ω1(k)-ρ11(k)ρ11(k);]]>步骤2、估计及抑制平稳噪音;定义语音阻塞滤波器J(k):J(k)=[‑R*(k),1]T;在时间帧l满足1≤l≤ls时,在每一个频带k,利用语音阻塞滤波器,阻塞掉目标语音,得到平稳噪音分量;在时间帧l满足1≤l≤ls时,在频域上计算每一个频带k的平稳噪音的功率谱密度PN,i(k);根据所观测语音谱Zi(l,k)和平稳噪音的功率谱密度PN,i(k),计算抑制掉平稳噪音之后的目标语音谱;步骤3、抑制定向噪音;在时间帧l满足l>ls时,继续抑制平稳噪音,且开始定向噪音抑制过程;目标语音和定向噪音来自不同的方向,根据步骤1的目标语音通道传输函数,目标语音的方向θ(k)为:θ(k)=∠R(k)/kω0;设定一带通滤波器,所述带通滤波器的通带为Δθp(k)、阻带为Δθs(k);判断目标语音和所观测语音之间的相位差,在当前时间帧,如果目标语音和所观测语音之间的相位差在通带Δθp(k)之内,则所观测语音信号为目标语音所主导,如果目标语音和所观测语音之间的相位差在阻带Δθs(k)之内,则所观测语音为定向噪音主导,使用带通滤波器将其过滤;最后可得到抑制了平稳噪音和定向噪音的目标语音信号。...

【技术特征摘要】
1.一种基于指定带宽的定向噪音抑制方法,其特征在于:包括
双麦克风语音采集模型,所述双麦克风语音采集模型所观测到的语音
信号均可分为两个信号通道;双麦克风语音采集模型所观测到的语音
信号包括目标语音信号和噪音信号;所述噪音信号包括与目标语音信
号方向不一致的定向噪音和非定向的平稳噪音;设置一帧时间帧ls>
1,在时间帧l满足1≤l≤ls时,所观测到的语音信号包括目标语音信号
和平稳噪音信号;在时间帧l满足l≥ls时,所观测到的语音信号包括
目标语音信号、平稳噪音信号和定向噪音信号;所述抑制方法的步骤
为:
步骤1、估计目标语音通道传输函数;
在时间帧l满足1≤l≤ls时,在频域上计算每一个频带k的第一通道
的自相关功率谱的期望平均值ρ11(k)、互相关功率谱的期望平均值
ρ21(k)、自相关功率谱系数的期望平均值Ω1(k)、互相关功率谱系数的
期望平均值Ω2(k);并根据下式估计目标语音通道传输函数:
R(k)=Ω2(k)-ρ11(k)ρ21(k)Ω1(k)-ρ11(k)ρ11(k);]]>步骤2、估计及抑制平稳噪音;
定义语音阻塞滤波器J(k):
J(k)=[-R*(k),1]T;
在时间帧l满足1≤l≤ls时,在每一个频带k,利用语音阻塞滤波器,
阻塞掉目标语音,得到平稳噪音分量;在时间帧l满足1≤l≤ls时,在
频域上计算每一个频带k的平稳噪音的功率谱密度PN,i(k);根据所观测
语音谱Zi(l,k)和平稳噪音的功率谱密度PN,i(k),计算抑制掉平稳噪音之
后的目标语音谱;
步骤3、抑制定向噪音;
在时间帧l满足l>ls时,继续抑制平稳噪音,且开始定向噪音抑
制过程;目标语音和定向噪音来自不同的方向,根据步骤1的目标语
音通道传输函数,目标语音的方向θ(k)为:
θ(k)=∠R(k)/kω0;
设定一带通滤波器,所述带通滤波器的通带为Δθp(k)、阻带为
Δθs(k);判断目标语音和所观测语音之间的相位差,在当前时间帧,
如果目标语音和所观测语音之间的相位差在通带Δθp(k)之内,则所观
测语音信号为目标语音所主导,如果目标语音和所观测语音之间的相
位差在阻带Δθs(k)之内,则所观测语音为定向噪音主导,使用带通滤
波器将其过滤;
最后可得到抑制了平稳噪音和定向噪音的目标语音信号。
2.如权利要求1所述的基于指定带宽的定向噪音抑制方法,其
特征在于:
所述步骤1具体包括:
步骤1-1、设置用于储存信息的缓冲区,缓冲区可储存时间帧l满
足1≤l≤ls时的语音信息;将观测信号z1(t)和z2(t)写入缓冲区;在时域
上,观测信号z1(t)和z2(t)表示为:
z1(t)=hS,1(t)*s(t)+n1(t)
z2(t)=hS,2(t)*s(t)+n2(t)(1)
式(1)中,s(t)为目标语音的时域信号,n1(t)和n2(t)分别为两路
不相关的平稳噪音的时域信号,hS,1(t)和hS,2(t)分别代表目标语音到两
个麦克风的时域传输函数,“*”为卷积运算符号;
步骤1-2、两路观测信号z1(t)和z2(t)形成两个通道,对每个通道
的数据进行加窗傅里叶变换:
Z1(l,k)=Σtw(t)z1(t)exp(-j2πtTk)]]>Z2(l,k)=Σtw(t)z2(t)exp(-j2πtTk)---(2)]]>式(2)中,w(t)为窗函数,l为时间帧,k为频带;
步骤1-3、根据傅里叶变换的线性性质,观测信号z1(t)和z2(t)在
频域可表示为:
Z1(l,k)=HS,1(k)S(l,k)+N1(l,k)Z2(l,k)=HS,2(k)S(l,k)+N2(l,k)---(3)]]>式(3)中,S(l,k)为目标语音的功率谱,N1(l,k)和N2(l,k)分别为
两个通道的平稳噪音的功率谱;定义R(k)为包括反应目标语音方位信
息的目标语音通道传输函数:
R(k)=HS,2(k)/HS,1(k);
步骤1-4、由时间帧l=1起,直至l=ls止,在每一个频带k,估计
第一通道的自相关功率谱Ψ11(l,k)和第二通道的自相关功率谱Ψ22(l,k):
Ψ11(l,k)=aΨ11(l-1,k)+(1-a)Z1(l,k)Z1*(l,k)Ψ22(l,k)=aΨ22(l-1,k)+(1-a)Z2(l,k)Z2*(l,k)---(4)]]>式(4)中,a为平滑因子,上标“*”为共轭算子;
步骤1-5、由时间帧l=1起,直至l=ls止,在每一个频带k,估计
互相关功率谱Ψ21(l,k):
Ψ21(l,k)=aΨ21(l-1,k)+(1-a)Z2(l,k)Z1*(l,k)---(5)]]>步骤1-6、由时间帧l=1起,直至l=ls止,在每一个频带k,估计
第一通道的功率谱自相关系数Γ11及功率谱互相关系数Γ21:
Γ11(l,k)=Ψ11(l,k)Ψ11*(l,k)Γ21(l,k)=Ψ11(l,k)Ψ21(l,k)---(6)]]>步骤1-7、估计第一通道的自相关功率谱的期望平均值ρ11(k)、互
相关功率谱的期望平均值ρ21(k)、第一通道的功率谱自相关系数的期
望平均值Ω1(k)、功率谱互相关系数的期望平均值Ω2(k):
ρ11(k)=1lsΣl=1lsΨ11(l,k),ρ21(k)=1lsΣl=1lsΨ21(l,k),]]>Ω1(k)=1ls&Sig...

【专利技术属性】
技术研发人员:唐明
申请(专利权)人:南京奇音石信息技术有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1