一种基于似然比测试的噪声鲁棒性的检测方法技术

技术编号:13180867 阅读:201 留言:0更新日期:2016-05-11 12:48
本发明专利技术公开了一种基于似然比测试的噪声鲁棒性的检测方法,分别从信噪比的估计、阈值的鲁棒性设置和拖尾失真消除三个方面进行改进,使得提出的算法相对于现有技术在低信噪比环境下尤其是非平稳噪声环境下具有更好的检测性能。本发明专利技术所述的方法与基于谐波特征的多观测似然比测试算法具有相似的语音边界检测正确率,但却比基于谐波特征的多观测似然比测试算法具有更好的声音检测精度,从而验证本方法要比传统的方法在性能上更为优异;同时,本方法在15dB和25dB的信噪比下具有相似的性能,说明它对噪声具有很好的鲁棒性;本发明专利技术在实际环境中可以作为语音识别或者声纹识别系统的前端预处理重要的有效方法,拥有很好的应用价值。

【技术实现步骤摘要】

本专利技术涉及语音处理和信号处理领域,特别指一种基于似然比测试的噪声鲁棒性 的检测方法。
技术介绍
语音端点检测(VAD)是语音处理相关技术中的一个非常关键的部分,它不仅可 用于语音增强中的语音/非语音检测,而且可应用于特征提取和语音信号去混响等过程中。 现有的语音信号端点检测算法主要分为三大类:基于时间域的端点检测方法、基于频率域 的端点检测方法和基于模型统计的端点检测方法。 实际应用中,高精度的语音端点检测对后续的语音增强、端点检测、语音识别或声 纹识别都有极其重要的作用。然而,现有的语音端点检测技术仍然存在着一些问题和不足, 尤其在实际信道环境下,由于语音信号清音和摩擦音成分的频谱特征与噪音具有很大相似 性,而现有大部分端点检测算法都是基于语音本身音节特征实现对语音和噪音的区分,因 此在检测端点的过程中,可能会丢失语音起始音或收尾音导致截断效应。同时,大多数算法 无法完整保留所有语音信息,当信噪比降低时,检测性能也将明显下降。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的缺陷,提供分别从信噪比的估计、 阈值的鲁棒性设置和拖尾失真消除三个方面进行改进,使得提出的算法相对于现有的算法 在低信噪比环境下尤其是非平稳噪声环境下具有更好检测性能的基于似然比测试的噪声 鲁棒性的检测方法。 本专利技术为解决上述技术问题采用以下技术方案:一种基于似然比测试的噪声鲁棒 性的检测方法,包括以下步骤: 51、 通过维纳滤波器对带噪语音信号进行语音增强,以便减弱带噪语音中的噪声信号 对干净语音的影响,且提高过滤后的噪声信号的平稳特性;经过维纳滤波器语音增强后的 带噪语音信号可以通过干净语音s(n)和干扰噪声痛禱藝加養到:. 其中,η为时间采样索引,且此时通过维纳滤波器后的干净语音信号和干扰噪声可以具 备统计独立且均值为零的特性; 52、 对带噪语音进行傅立叶变换,经过滤波的带噪语音信号在频谱域上通过干净语音 信号的频谱因子叠加干扰噪声的频谱因子得到;其中,__!#、_尾:_和___:为每帧信号的短时傅立叶因子,m为帧索引,k为帧内 的各个频段值,?和釋3分别表示非语音帧和语音帧; 53、 计算似然比,干净语音信号和噪声信号的概率密度都满足高斯分布时,观测信号 Χ(η\ k)在Ηβ和%下的概率密度函数为其中= 为语音信号的功率谱,權|_i:繼夂麵繼麵为噪声 信号的功率谱; 该帧第k频段的似然比值为:其中,^ 儀_,樣 i:S_ 后验?目噪比,且先验?目噪比IUa和后验?目噪比Iw#:在直接决策估计器中存在着以下关系:其中炫鍾一令_数平稳因 穿場前一?_的:语音:_号金计 一帧的噪声功率谱; 54、 进行噪声估计,并设定阈值_,将阈值_与似然比的值相比较来确定当前帧为语音 段或非语音段,当似然比的值大于阈值时,初次判定该帧为语音帧,而当似然比的值小于阈 值时,就认定该帧为非语音帧,具体可以通过如下公式表示:其中,Κ为频带总数;%和分别表示非语音帧和语音帧; 55、 确定决策规则,m帧的对数似然比为:表示以In为中心的连续2M+1帧,则以这2M+1个对数似然比 为对象的判决规则为:其中旨賴对于其中的第k频段下的对数似然比1_魏^:,将观测信号在祖和 的概率代入其中得到:先验信噪比龜后验信噪比通过最大似然估计算法得到,即:因此,对数似然比的值取决于噪声能量谱 se、拖尾失真消除,当信噪比低时,噪声能量谱变大,通过降低选取的阈值符来 降低发声段误判概率;反之,通过增大阈值q来和高信噪比信号进行匹配; 带噪语音功率谱谱由带噪信号功率谱編平滑得到,平滑因子 为时频相关函数,则:其麵_%_蠢一,与:__1目髮通·論觀矛利用基于最小统计的噪声估计就可以得到 每帧信号最小噪声功率谱。与所述噪声能量谱相关的阈值符^为:其中%是该阈值的一个常系数。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:本专利技术所提出的 VAD算法与基于谐波特征的M0LRT算法具有相似的SBR正确率,但却比基于谐波特征的M0LRT 算法具有更为优异的多VAcc;本专利技术提出的VAD算法在15dB和25dB的信噪比下具有相似的 性能,说明本方法对噪声具有很好的鲁棒性。【附图说明】图1(a)是干净语音的示意图。 图1(b)是基于Sohn的VAD结果示意图。 图1(c)是基于Tan的VAD结果示意图。图1(d)是基于本专利技术所述方法的VAD结果示意图。 图2(a)是不同信噪比下的段级性能比较。 图2(b)是不同信噪比下的帧级性能比较。 图2(c)是不同信噪比下语音帧的正确个数。 图3是本专利技术中基于语音增强的语音端点检测框架示意图。【具体实施方式】 下面结合附图对本专利技术的技术方案做进一步的详细说明: 如图3所示,本专利技术采取的技术方案如下:一种基于似然比测试的噪声鲁棒性的检测方 法,包括以下步骤: S1、通过维纳滤波器对带噪语音信号进行语音增强,以便减弱带噪语音中的噪声信号 对干净语音的影响,且提高过滤后的噪声信号的平稳特性;经过维纳滤波器语音增强后的 带噪语音信号可以通过干净语音s(n)和干扰噪声痛_基加養:??爸:讀 其中,η为时间采样索引,且此时通过维纳滤波器后的干净语音信号和干扰噪声可以具 备统计独立且均值为零的特性; 52、 对带噪语音进行傅立叶变换,经过滤波的带噪语音信号在频谱域上通过干净语音 信号的频谱因子叠加干扰噪声的频谱因子得到;其中,物爾和断紙鮮为每帧信号的短时傅立叶因子,m为帧索引,k为帧内 的各个频段值,ft和分别表示非语音帧和语音帧; 53、 计算似然比,干净语音信号和噪声信号的概率密度都满足高斯分布时,观测信号 ___在拓和%下的概率密度函数为其中___:::二_〖|_漏誦为语音信号的功率谱,_驗:徽=::麵 信号的功率谱; 该帧第k频段的似然比值为:其中,s 后验?目噪比,且先验?目噪比和后验?目噪比^^&在直接决策估计器中存在着以下关系:其中吞逶一,霜数因編:_:表麵一语音傷号愈计,:fe _表承_ 一帧的噪声功率谱; 54、 进行噪声估计,并设定阈值S,将阈值q与似然比的值相比较来确定当前帧为语音 段或非语音段,当似然比的值大于阈值时,初次判定该帧为语音帧,而当似然比的值小于阈 值时,就认定该帧为非语音帧,具体可以通过如下公式表示:其中,K为频带总数;_和醒:分别表示非语音帧和语音帧; 55、 确定决策规则,m帧的对数似然比为:I?:種表示以L为中心的连续2M+1帧,则以这2M+1个对数似然比 为对象的判决规则为:其中厶指代每一齓对于其中的第k频段下的对数似然比__^丄,将观测信号在観和 観的概率代入其中得到:先验信噪比由后验信噪比通过最大似然估计算法得到,即:因此,对数似然比的值取决于噪声能量谱 se、拖尾失真消除,当信噪比低时,噪声能量谱变大,通过降低选取的阈值^|来 降低发声段误判概率;反之,通过增大阈值η来和高信噪比信号进行匹配; 带噪语音功率谱谱__雜由带噪信号功率谱隱平滑得到,平滑因子#|儀|为 时频相关函数,则:其日賴_|_的,稳:因:識利用基于最小统计的噪声估计就可以得到 每帧信号最小噪声功率谱每憂I,与所述噪声能量谱相关的阈值1u为:其中_是该阈值的一个常系数。具体地,本专利技术带噪语音本文档来自技高网...

【技术保护点】
一种基于似然比测试的噪声鲁棒性的检测方法,包括以下步骤:S1、通过维纳滤波器对带噪语音信号进行语音增强,以便减弱带噪语音中的噪声信号对干净语音的影响,且提高过滤后的噪声信号的平稳特性;经过维纳滤波器语音增强后的带噪语音信号干净语音和干扰噪声其中,n为时间采样索引,且此时通过维纳滤波器后的干净语音信号和干扰噪声可以具备统计独立且均值为零的特性;S2、对带噪语音进行傅立叶变换,经过滤波的带噪语音信号在频谱域上通过干净语音信号的频谱因子叠加干扰噪声的频谱因子得到;(1)其中,、和为每帧信号的短时傅立叶因子,m为帧索引,k为帧内的各个频段值,和分别表示非语音帧和语音帧;S3、计算似然比,干净语音信号和噪声信号的概率密度都满足高斯分布时,观测信号在和下的概率密度函数为(2)其中为语音信号的功率谱,为噪声信号的功率谱;该帧第k频段的似然比值为:(3)其中,,分别表示先验信噪比和后验信噪比,且先验信噪比和后验信噪比在直接决策估计器中存在着以下关系:(4)其中一帧的噪声功率谱;S4、 进行噪声估计,并设定阈值,将阈值与似然比的值相比较来确定当前帧为语音段或非语音段,当似然比的值大于阈值时,初次判定该帧为语音帧,而当似然比的值小于阈值时,就认定该帧为非语音帧,具体可以通过如下公式表示:(5)其中,K为频带总数;和分别表示非语音帧和语音帧;S5、确定决策规则,m帧的对数似然比为:表示以为中心的连续2M+1帧,则以这2M+1个对数似然比为对象的判决规则为:其中对于其中的第k频段下的对数似然比,将观测信号在和的概率代入其中得到:先验信噪比后验信噪比通过最大似然估计算法得到,即:因此,对数似然比的值取决于噪声能量谱;S6、拖尾失真消除,当信噪比低时,噪声能量谱变大,通过降低选取的阈值来降低发声段误判概率;反之,通过增大阈值来和高信噪比信号进行匹配;带噪语音功率谱谱由带噪信号功率谱平滑得到,平滑因子为时频相关函数,则:其利用基于最小统计的噪声估计就可以得到每帧信号最小噪声功率谱,与所述噪声能量谱相关的阈值为:其中是该阈值的一个常系数。...

【技术特征摘要】

【专利技术属性】
技术研发人员:李为朱杰包旭雷
申请(专利权)人:深圳市音加密科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1