基于MMSE误差准则的先验信噪比估计方法技术

技术编号:12775618 阅读:111 留言:0更新日期:2016-01-27 18:55
本发明专利技术公开了一种用于语音增强的基于MMSE误差准则的先验信噪比估计方法,属于语音信号处理技术领域。针对语音增强技术中的先验信噪比估计问题,首先基于MMSE误差准则对含噪语音的先验信噪比作初步估计,所得的先验信噪比估计值通过维纳滤波计算得到第一个系统增益因子,利用第一个系统增益因子和含噪语音幅度谱值计算得到语音功率谱估计值,再利用所得的语音功率谱估计值和噪声的功率谱估计值对先验信噪比进行再一次估计,得到最终的先验信噪比估计值。该先验信噪比估计值代入后续的语音增强步骤中处理,得到去噪的估计清音信号。基于MMSE误差准则的先验信噪比估计方法既有效地抑制了估计清音中的背景噪声成分,又避免了对清音成分的过度损伤,使得估计清音的听觉质量得以改善,语音增强算法的性能得以提高。

【技术实现步骤摘要】

本专利技术涉及语音信号处理
,更具体地,涉及一种基于MMSE误差准则的先验信噪比估计方法
技术介绍
在现实生活中,人们在进行语音对话和语音通信的过程中总不可避免地受到各种背景噪声的干扰,如机场、餐厅和街道等环境中的嘈杂声、高速行驶汽车中的引擎噪声等等。这些噪声的存在会严重破坏语音信号的听觉质量和声学特性,使得人们的对话和通信过程受到严重干扰并引起对话接听者的听觉疲劳。因此,如何在现实生活中利用计算机等智能设备来去除语音通信过程的背景噪声一直是国内外学者研究的热点课题。语音增强技术是噪声背景下进行语音通信和语音识别的不可或缺的一部分,它在解决噪声污染问题、改进语音通信质量、提高语音可懂度等方面发挥着重要作用。目前,基于单麦克风输入的语音增强算法由于具备简单有效且有利于硬件实现的特点而被广泛地应用于各类语音通信系统中。经典的语音增强算法有谱减法、最小均方误差算法、维纳滤波算法等。这些算法的运算过程大都是在变换域进行,并且针对语音和噪声的不同特征,提出相对应的噪声消除技术。根据实际应用环境的不同特点,其在变换域中对于增益因子的计算方法也不尽相同。这些算法存在一共同特点,其增益因子皆可以表示为语音先验信噪比的函数,因此先验信噪比估计的准确度在很大程度上决定了这些语音增强算法的性能和噪声去除效果。
技术实现思路
针对上述语音增强算法中先验信噪比的估计问题,本专利技术提出了一种更准确的基于MMSE误差准则的先验信噪比估计方法。本专利技术的技术方案为:一种基于MMSE误差准则的先验信噪比估计方法,包括以下步骤:1)将含噪语音信号yt进行分帧和加窗处理,得到含噪语音帧信号yt(n);2)对含噪语音帧信号yt(n)进行离散傅里叶变换,即得到含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k);3)对含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k)进行噪声成分功率谱的估计,得到第n帧第k频率噪声功率谱估计值通过一帧延时得到前一帧第k频率的清音幅度谱估计值并用该值计算得到前一帧第k频率清音功率谱估计值4)将含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k)和第n帧第k频率噪声的功率谱估计值用于计算第n帧第k频率语音的后验信噪比将前一帧第k频率的清音功率谱估计值和第n帧第k频率噪声功率谱估计值用于计算前一帧第k频率语音的先验信噪比5)第n帧第k频率语音的后验信噪比和前一帧第k频率先验信噪比代入到MMSE先验信噪比的估计计算中,即得到第n帧第k频率成分的MMSE先验信噪比估计值6)用维纳滤波方法和步骤5)中所得第n帧第k频率成分的MMSE先验信噪比估计值计算出第一个系统增益因子G1(n,k),利用第一个增益因子G1(n,k)和含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k)估计第n帧第k频率的语音功率谱值该功率谱估计值结合第n帧第k频率噪声功率谱估计值对先验信噪比进行再一次估计,得到最终的先验信噪比估计值7)最终的先验信噪比估计值结合含噪语音第n帧第k频率成分的幅度谱值yt(n,k)对第n帧第k频率的清音幅度谱值进行估计,得到第n帧第k频率清音幅度谱的估计值8)对第n帧第k频率清音幅度谱估计值进行离散傅里叶逆变换,得到估计清音帧信号9)估计清音帧信号进行去窗和重叠相加处理,得到估计清音信号进一步的,所述步骤3)获取含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k),用最小统计方法估计得到第n帧第k频率噪声功率谱估计值并通过延时一帧方法来获取前一帧第k频率的清音幅度谱估计值利用前一帧第k频率的清音幅度谱估计值计算得到前一帧第k频率清音功率谱估计值进一步的,所述步骤6)中第一个系统增益因子G1(n,k)的计算方式为:G1(n,k)=ξ^n,kMMSEξ^n,kMMSE+1;]]>第n帧第k频率的语音功率谱估计值的计算方式为:λ^X(n,k)=|G1(n,k)·yt(n,k)|2]]>最终先验信噪比估计值的计算方式为:ξ^^n,k,MMSE=λ^X(n,k)λ^D(n,k).]]>进一步的,所述步骤7)中,用最终的先验信噪比估计值计算第n帧第k频率的清音幅度谱值,即得到第n帧第k频率清音幅度谱的估计值其具体过程为:将最终的先验信噪比估计值用于计算第二个系统增益因子G2(n,k),第二个系统增益因子G2(n,k)结合含噪语音第n帧第k频率成分的幅度谱值yt(n,k)计算得到第n帧第k频率清音的幅度谱估计值具体如下所示:G2(n,k)=ξ^^n,kMMSEξ^^n,kMMSE+1]]>x^t(n,k)=G2(n,k)·yt(n,k).]]>与现有技术相比,本专利技术的有益效果为:本专利技术采用基于MMSE误差准则对语音增强算法中的先验信噪比估计方法进行改进,改进的方法在保留原算法优点的基础上,语音噪声分量的去除效果更加显著,清音保留成分失真度降低,增强后清晰语音的听觉质量也明显提高。附图说明图1为语音增强算法的整体结构框图。图2为语音增强处理模块的结构框图。图3为先验信噪比估计模块的结构框图。图4为MMSE估计先验信噪比的计算方法中数值积分求解所得的数值表。图5为原始清音、含噪语音、DD算法估计合成清音以及本专利技术算法估计合成清音的语谱图。具体实施方式下面结合附图对本专利技术进行进一步阐述。如图1所示,含噪语音信号yt经过分帧和加窗处理后,得到含噪语音帧信号yt(n),含噪语音帧信号yt(n)经过离散傅里叶变换后,得到含噪语音第n帧第k频率成分的幅度谱值yt(n,k),该幅度谱值经过语音增强处理模块的运算后,输出第n帧第k频率清音幅度谱的估计值对第n帧第k频率清音幅度谱的估计值进行离散傅里叶逆变换后得到估计清音的帧信号该帧信号通过去窗和重叠相加处理后,输出估计清音信号语音增强处理模块的具体实现步骤如图2所示,用最小统计方法在含噪语音第n帧第k频率成分的幅度谱值yt(n,k)中计算出第n帧第k频率噪声功率谱估计值通过一帧延时得到前一帧第k频率的清音幅度谱估计值并计算前一帧第k频率清音功率谱估计值将含噪语音第n帧第k频率成分幅度谱值yt(n,k)、第n帧第k频率噪声功率谱估计值和前一帧第k频率清音功率谱估计值作为输入变量,代入先验信噪比估计的核心模块中进行计算,得到最终的先验信噪比估计值该先验信噪比最终估计值结合含噪语音第n帧第k频率成分的幅度谱值yt(n,k)计算得到第n帧第k频率清音幅度谱的估计值语音增强处理模块最后输出第n帧第k频率清音幅度谱的估计值先验信噪比估计模块的具体实现步骤如图3所示,含噪语音第n帧第k频率成分的幅度谱值yt(n,k)结合第n帧第k频率噪声的功率谱估计值计算得到第n帧第k频率语音的后验信噪比前一帧第k频率的清音功率谱估计值结合第n帧第k频率噪声的功率谱估计值计算得到前一帧第k频率语音的先验信噪比第n帧第k频率语音的后验信噪比和前一帧第k频率语音的先验信噪比作为输入变量代入MMSE先本文档来自技高网...

【技术保护点】
一种基于MMSE误差准则的先验信噪比估计方法,其特征在于,包括:1)将含噪语音信号yt进行分帧和加窗处理,得到含噪语音帧信号yt(n);2)对含噪语音帧信号yt(n)进行离散傅里叶变换,即得到含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k);3)对含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k)进行噪声成分功率谱的估计,得到第n帧第k频率噪声功率谱估计值通过一帧延时得到前一帧第k频率的清音幅度谱估计值并用该值计算得到前一帧第k频率清音功率谱估计值4)将含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k)和第n帧第k频率噪声的功率谱估计值用于计算第n帧第k频率语音的后验信噪比将前一帧第k频率的清音功率谱估计值和第n帧第k频率噪声功率谱估计值用于计算前一帧第k频率语音的先验信噪比5)第n帧第k频率语音的后验信噪比和前一帧第k频率先验信噪比代入到MMSE先验信噪比的估计计算中,即得到第n帧第k频率成分的MMSE先验信噪比估计值6)用维纳滤波方法和步骤5)中所得第n帧第k频率成分的MMSE先验信噪比估计值计算出第一个系统增益因子G1(n,k),利用第一个增益因子G1(n,k)和含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k)估计第n帧第k频率的语音功率谱值该功率谱估计值结合第n帧第k频率噪声功率谱估计值对先验信噪比进行再一次估计,得到最终的先验信噪比估计值7)最终的先验信噪比估计值结合含噪语音第n帧第k频率成分的幅度谱值yt(n,k)对第n帧第k频率的清音幅度谱值进行估计,得到第n帧第k频率清音幅度谱的估计值8)对第n帧第k频率清音幅度谱估计值进行离散傅里叶逆变换,得到估计清音帧信号9)估计清音帧信号进行去窗和重叠相加处理,得到估计清音信号...

【技术特征摘要】
1.一种基于MMSE误差准则的先验信噪比估计方法,其特征在于,包括:
1)将含噪语音信号yt进行分帧和加窗处理,得到含噪语音帧信号yt(n);
2)对含噪语音帧信号yt(n)进行离散傅里叶变换,即得到含噪语音第n帧第k频
率成分的离散幅度谱值yt(n,k);
3)对含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k)进行噪声成分功率谱
的估计,得到第n帧第k频率噪声功率谱估计值通过一帧延时得到前一帧
第k频率的清音幅度谱估计值并用该值计算得到前一帧第k频率清音功率
谱估计值4)将含噪语音第n帧第k频率成分的离散幅度谱值yt(n,k)和第n帧第k频率噪
声的功率谱估计值用于计算第n帧第k频率语音的后验信噪比将前一
帧第k频率的清音功率谱估计值和第n帧第k频率噪声功率谱估计值
用于计算前一帧第k频率语音的先验信噪比5)第n帧第k频率语音的后验信噪比和前一帧第k频率先验信噪比代
入到MMSE先验信噪比的估计计算中,即得到第n帧第k频率成分的MMSE先验信
噪比估计值6)用维纳滤波方法和步骤5)中所得第n帧第k频率成分的MMSE先验信噪比估
计值计算出第一个系统增益因子G1(n,k),利用第一个增益因子G1(n,k)和含
噪语音第n帧第k频率成分的离散幅度谱值yt(n,k)估计第n帧第k频率的语音功率
谱值该功率谱估计值结合第n帧第k频率噪声功率谱估计值
对先验信噪比进行再一次估计,得到最终的先验信噪比估计值7)最终的先验信噪比估计值结合含噪语音第n帧第k频率成分的幅度谱
值yt(n,k)对第n帧第k频率的清音幅度谱值进行估计,得到第n帧第k频率清音幅
度谱的估计值8)对第n帧第k频率清音幅度谱估计值进行离散傅里叶逆变换,得到估
计...

【专利技术属性】
技术研发人员:李宇林胜义谭洪舟农革
申请(专利权)人:广东顺德中山大学卡内基梅隆大学国际联合研究院中山大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1