基于多域联合估计的自适应语音检测方法技术

技术编号：10126281 阅读：137 留言：0更新日期：2014-06-12 18:03

本发明专利技术公开一种基于多域联合估计的自适应语音检测方法，能在复杂环境中自适应检测语音，准确性和可靠性好，检测复杂度低。本发明专利技术的语音检测方法，包括：信号预处理，频谱稳定性判断，平稳噪声语音检测，非平稳噪声语音检测，语音段信号输出。

全部详细技术资料下载

【技术实现步骤摘要】
基于多域联合估计的自适应语音检测方法
本专利技术属于语音检测
，特别是一种基于多域联合估计的自适应语音检测方法。
技术介绍
现有通信设备多代共存，且通信频段、调制方式、数据速率、数据帧格式各不相同，难以实现直接互联互通；通信环境复杂多变，语音通信的保障难度加大。语音检测技术是语音信号处理的前端，直接影响着语音识别、语音增强、说话人识别等后续处理，在语音通信中起着重要作用。语音检测技术大致分为两类：门限比较法和模型匹配法。门限比较法根据语音和噪声的不同特性，提取不同的特征参数，设置合适的门限进行判决，主要可以分为时域和变换域两类。时域检测方法主要有短时能量法、短时平均幅度法(AMDF)、短时平均幅度差法、短时平均过零率、短时自相关函数等。变换域检测方法主要有谱熵法、倒谱法、频带差法、小波分析法等。模型匹配法主要有贝里斯模型匹配、神经网络模型法等。下面是几种现有的语音检测方法的简介。1、短时平均幅度差法(AMDF)语音信号的浊音具有准周期性，在一帧语音信号内，信号近似平稳，基音周期近似相等，若为语音信号的浊音，在整数倍周期的位置会出现极小值，在这些点上信号幅度差近似为0；但清音和噪声不具备周期性的特点，不同周期的信号幅度差值较大。短时平均幅度差法在高信噪比下具有很好的语音检测效果，由于只有加减运算，计算量比自相关函数法显著降低；但在低信噪比的环境下，检测效果较差。2、短时自相关函数法自相关函数值，两个极大值之间为一个信号周期，即为基音周期。短时自相关函数法适合噪声环境下的语音信号检测，语音信号在低信噪比的情况下基音周期不发生变化，检测效果明显好于短时能量...
基于多域联合估计的自适应语音检测方法

【技术保护点】
一种基于多域联合估计的自适应语音检测方法，其特征在于，包括如下步骤：10）信号预处理：对输入信号进行滤波、采样、量化、分帧和加窗处理，得到预处理信号；20）频谱稳定性判断：对预处理信号的噪声段进行频谱稳定性检测，判断背景噪声是平稳噪声或非平稳噪声；30）平稳噪声语音检测：对平稳噪声下的信号进行语音检测，得到检测语音信号；40）非平稳噪声语音检测：对非平稳噪声下的信号进行语音检测，得到检测语音信号；50）语音段信号输出：在检测语音信号的终止帧后加几帧拖尾延迟保护，输出语音段信号。

【技术特征摘要】
1.一种基于多域联合估计的自适应语音检测方法，其特征在于，包括如下步骤：(10)信号预处理：对输入信号进行滤波、采样、量化、分帧和加窗处理，得到预处理信号；(20)频谱稳定性判断：对预处理信号的噪声段进行频谱稳定性检测，判断背景噪声是平稳噪声或非平稳噪声；(30)平稳噪声语音检测：对平稳噪声下的信号进行语音检测，得到检测语音信号；(40)非平稳噪声语音检测：对非平稳噪声下的信号进行语音检测，得到检测语音信号；(50)语音段信号输出：在检测语音信号的终止帧后加几帧拖尾延迟保护，输出语音段信号；所述频谱稳定性判断(20)步骤包括：(21)计算预处理信号噪声段信号的谱值：(22)计算预处理信号噪声段信号谱平均值:(23)计算各点与谱均值之间的差值：(24)频谱稳定性判断：如果Dfn的值均不超过T，就认为当前噪声段信号是平稳信号，反之则是非平稳信号；式中，s(m)为信号函数，w(m)是窗函数，M是频谱的采样点数，T为设定的门限值，各点与均值之间的频谱差值为Dfn，m是语音信号函数和窗函数的各离散点，n是对信号进行FFT变换后的各离散点；所述平稳噪声语音检测(30)步骤包括：(31)信噪比估算：选取待测语音段，根据下式估算信噪比SNR，式中，Ef是含噪语音信号的能量，Es是语音信号的能量，En是噪声信号的能量；(32)信噪比高低判断：设置门限值S，如果噪声信号的能量超过门限值S，则判定为高信噪比，反之，判定为低信噪比；(33)高信噪比语音检测：对高信噪比语音信号，采用短时平均幅度差算法对其进行检测；(34)低信噪比语音检测：对低信噪比语音信号，采用多特征融合算法对其进行检测；所述非平稳噪声语音检测(40)步骤包括：(41)计算前K(K＝10)帧能量平均值：式中，Ei为第i帧信号的能量；(42)计算信号的频谱概率密度函数：式中，s(fi)是第i帧信号的谱函数，N为该帧信号的长度；(43)计算每帧信号的谱熵值：(44)计算前K(K＝10)帧谱熵平均值：式中，Hi为第i帧信号的谱熵值；(45)计算第n帧信号的ESE特征值：式中，Xn＝(Esn-Eave)(Hn-Have)，Eave为能量平均值，Have为谱熵平均值，Esn为第n帧信号能量值，Hn为第n帧信号谱熵值；(46)语音信号初判：设置一个较低的门限，大于该门限值的信号，初步判定为语音信号，反之初步判定为噪声信号；(47)语音信号检测：对初步判定为语音的信号采用小波变换和神经网络结合算法进行综合判决。2.根据权利要求1所述的自适应语音检测方法，其特征在于，所述信号预处理(10)步骤包括：(11)滤波：滤除输入语音信号中的高频率脉冲噪声，有效减小语音信号频段以外信号的干扰；(12)采样、量化：以大于处理信号最高频率两倍的采样速率，对处理信号采样、量化；(13)分帧：按一帧信号时长20ms和交叠长度10ms将语音信号分帧；(14)加窗：对每帧语音信号进行加窗，得到预处理信号。3.根据权利要求1所述的自适应语音检测方法，其特征在于，所述高信噪比语音检测(33)步骤包括：(331)计算短时幅度差函数：式中，sn(m)＝w(m)s(n+m)，sn(m+k)＝w(m+...

【专利技术属性】
技术研发人员：范建华，王统祥，吕遵明，万留进，成洁，
申请(专利权)人：中国人民解放军总参谋部第六十三研究所，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人