基于指定带宽的定向噪音抑制方法技术

技术编号：15106103 阅读：80 留言：0更新日期：2017-04-08 16:45

本发明专利技术公开了一种基于指定带宽的定向噪音抑制方法，具体包括：步骤1、根据传输通道的功率谱的期望评价值估计目标语音通道传输函数；步骤2、估计及抑制平稳噪音分量；定义一语音阻塞滤波器，阻塞掉目标语音，得到平稳噪音分量，并计算抑制掉平稳噪音之后的目标语音谱；步骤3、定向噪音抑制；判断目标语音和所观测语音之间的相位差，如果当前时频单元的所观测语音为定向噪音主导，使用带通滤波器将其过滤；最后可得到抑制了平稳噪音和定向噪音的目标语音信号。本发明专利技术系统简单，且在抑制噪音的过程中有效区分了定向噪声和平稳噪声分量的不同，并基于这二者性质上不同，采用不同的方法进行抑制，噪音抑制效果更好。有很高的实用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音信号的噪音抑制方法，具体涉及一种基于指定带宽的定向噪音抑制方法。
技术介绍
有关定向噪音和非定向噪音：智能语音相关信号采集设备在采集用户语音的同时通常会被各种各样的噪音干扰。从噪音的来源可以分为定向噪音和非定向噪音两种类型。所谓定向噪音是由一个独立声源所产生，相对于采集终端麦克风阵列方向固定，在信号处理领域通常抽象为一个点源信号。比如在家居环境下电视机的声音、闹钟的声音等等。非定向噪音是指多个能量相差不多的噪音源同时发出噪音，并且这些噪音源相对于麦克风阵列方向并不固定。比如马路上、咖啡厅等等环境噪音。有关噪音抑制：由于噪音的存在会对听觉感知、后续语音识别造成极大的干扰，噪音抑制技术的目的就是把采集到的信号中掺杂的噪音基于语音或者噪音独有的特征给抑制掉，同时尽可能保证目标语音不失真。和非定向噪音相比，定向噪音一般能量较大，比如在智能电视应用中，电视机音箱发出的声音能量要远高于环境噪音，甚至会高于目标语音信号。因此，如果该定向噪音不能被抑制，降会对后续的语音识别造成极大的干扰。定向噪音的另外一个特点是能量随时间快速变化，平稳性非常差。比如各种音乐信号能量起伏非常快，实时追踪、估计噪音在每一时间帧的能量将非常困难，采用常规的估计噪音能量的方法不再有效。噪音抑制要满足智能交互的实时性，不然用户交互体验度会很差。一方面，计算复杂度不能太高。另一方面，噪音抑制...

【技术保护点】
一种基于指定带宽的定向噪音抑制方法，其特征在于：包括双麦克风语音采集模型，所述双麦克风语音采集模型所观测到的语音信号均可分为两个信号通道；双麦克风语音采集模型所观测到的语音信号包括目标语音信号和噪音信号；所述噪音信号包括与目标语音信号方向不一致的定向噪音和非定向的平稳噪音；设置一帧时间帧ls＞1，在时间帧l满足1≤l≤ls时，所观测到的语音信号包括目标语音信号和平稳噪音信号；在时间帧l满足l≥ls时，所观测到的语音信号包括目标语音信号、平稳噪音信号和定向噪音信号；所述抑制方法的步骤为：步骤1、估计目标语音通道传输函数；在时间帧l满足1≤l≤ls时，在频域上计算每一个频带k的第一通道的自相关功率谱的期望平均值ρ11(k)、互相关功率谱的期望平均值ρ21(k)、自相关功率谱系数的期望平均值Ω1(k)、互相关功率谱系数的期望平均值Ω2(k)；并根据下式估计目标语音通道传输函数：R(k)=Ω2(k)-ρ11(k)ρ21(k)Ω1(k)-ρ11(k)ρ11(k);]]>步骤2、估计及抑制平稳噪音；定义语音阻塞滤波器J(k)：J(k)＝[‑R...

【技术特征摘要】
1.一种基于指定带宽的定向噪音抑制方法，其特征在于：包括
双麦克风语音采集模型，所述双麦克风语音采集模型所观测到的语音
信号均可分为两个信号通道；双麦克风语音采集模型所观测到的语音
信号包括目标语音信号和噪音信号；所述噪音信号包括与目标语音信
号方向不一致的定向噪音和非定向的平稳噪音；设置一帧时间帧ls＞
1，在时间帧l满足1≤l≤ls时，所观测到的语音信号包括目标语音信号
和平稳噪音信号；在时间帧l满足l≥ls时，所观测到的语音信号包括
目标语音信号、平稳噪音信号和定向噪音信号；所述抑制方法的步骤
为：
步骤1、估计目标语音通道传输函数；
在时间帧l满足1≤l≤ls时，在频域上计算每一个频带k的第一通道
的自相关功率谱的期望平均值ρ11(k)、互相关功率谱的期望平均值
ρ21(k)、自相关功率谱系数的期望平均值Ω1(k)、互相关功率谱系数的
期望平均值Ω2(k)；并根据下式估计目标语音通道传输函数：
R(k)=Ω2(k)-ρ11(k)ρ21(k)Ω1(k)-ρ11(k)ρ11(k);]]>步骤2、估计及抑制平稳噪音；
定义语音阻塞滤波器J(k)：
J(k)＝[-R*(k),1]T；
在时间帧l满足1≤l≤ls时，在每一个频带k，利用语音阻塞滤波器，
阻塞掉目标语音，得到平稳噪音分量；在时间帧l满足1≤l≤ls时，在
频域上计算每一个频带k的平稳噪音的功率谱密度PN,i(k)；根据所观测
语音谱Zi(l,k)和平稳噪音的功率谱密度PN,i(k)，计算抑制掉平稳噪音之
后的目标语音谱；
步骤3、抑制定向噪音；
在时间帧l满足l＞ls时，继续抑制平稳噪音，且开始定向噪音抑
制过程；目标语音和定向噪音来自不同的方向，根据步骤1的目标语
音通道传输函数，目标语音的方向θ(k)为：
θ(k)＝∠R(k)/kω0；
设定一带通滤波器，所述带通滤波器的通带为Δθp(k)、阻带为
Δθs(k)；判断目标语音和所观测语音之间的相位差，在当前时间帧，
如果目标语音和所观测语音之间的相位差在通带Δθp(k)之内，则所观
测语音信号为目标语音所主导，如果目标语音和所观测语音之间的相
位差在阻带Δθs(k)之内，则所观测语音为定向噪音主导，使用带通滤
波器将其过滤；
最后可得到抑制了平稳噪音和定向噪音的目标语音信号。
2.如权利要求1所述的基于指定带宽的定向噪音抑制方法，其
特征在于：
所述步骤1具体包括：
步骤1-1、设置用于储存信息的缓冲区，缓冲区可储存时间帧l满
足1≤l≤ls时的语音信息；将观测信号z1(t)和z2(t)写入缓冲区；在时域
上，观测信号z1(t)和z2(t)表示为：
z1(t)＝hS,1(t)*s(t)+n1(t)
z2(t)＝hS,2(t)*s(t)+n2(t)(1)
式(1)中，s(t)为目标语音的时域信号，n1(t)和n2(t)分别为两路
不相关的平稳噪音的时域信号，hS,1(t)和hS,2(t)分别代表目标语音到两
个麦克风的时域传输函数，“*”为卷积运算符号；
步骤1-2、两路观测信号z1(t)和z2(t)形成两个通道，对每个通道
的数据进行加窗傅里叶变换：
Z1(l,k)=Σtw(t)z1(t)exp(-j2πtTk)]]>Z2(l,k)=Σtw(t)z2(t)exp(-j2πtTk)---(2)]]>式(2)中，w(t)为窗函数，l为时间帧，k为频带；
步骤1-3、根据傅里叶变换的线性性质，观测信号z1(t)和z2(t)在
频域可表示为：
Z1(l,k)=HS,1(k)S(l,k)+N1(l,k)Z2(l,k)=HS,2(k)S(l,k)+N2(l,k)---(3)]]>式(3)中，S(l,k)为目标语音的功率谱，N1(l,k)和N2(l,k)分别为
两个通道的平稳噪音的功率谱；定义R(k)为包括反应目标语音方位信
息的目标语音通道传输函数：
R(k)＝HS,2(k)/HS,1(k)；
步骤1-4、由时间帧l＝1起，直至l＝ls止，在每一个频带k，估计
第一通道的自相关功率谱Ψ11(l,k)和第二通道的自相关功率谱Ψ22(l,k)：
Ψ11(l,k)=aΨ11(l-1,k)+(1-a)Z1(l,k)Z1*(l,k)Ψ22(l,k)=aΨ22(l-1,k)+(1-a)Z2(l,k)Z2*(l,k)---(4)]]>式(4)中，a为平滑因子，上标“*”为共轭算子；
步骤1-5、由时间帧l＝1起，直至l＝ls止，在每一个频带k，估计
互相关功率谱Ψ21(l,k)：
Ψ21(l,k)=aΨ21(l-1,k)+(1-a)Z2(l,k)Z1*(l,k)---(5)]]>步骤1-6、由时间帧l＝1起，直至l＝ls止，在每一个频带k，估计
第一通道的功率谱自相关系数Γ11及功率谱互相关系数Γ21：
Γ11(l,k)=Ψ11(l,k)Ψ11*(l,k)Γ21(l,k)=Ψ11(l,k)Ψ21(l,k)---(6)]]>步骤1-7、估计第一通道的自相关功率谱的期望平均值ρ11(k)、互
相关功率谱的期望平均值ρ21(k)、第一通道的功率谱自相关系数的期
望平均值Ω1(k)、功率谱互相关系数的期望平均值Ω2(k)：
ρ11(k)=1lsΣl=1lsΨ11(l,k),ρ21(k)=1lsΣl=1lsΨ21(l,k),]]>Ω1(k)=1ls&Sig...

【专利技术属性】
技术研发人员：唐明，
申请(专利权)人：南京奇音石信息技术有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人