瞬态噪声的去噪方法技术

技术编号:9435199 阅读:110 留言:0更新日期:2013-12-12 01:04
本发明专利技术公开了瞬态噪声的去噪方法,属于信号处理技术领域。本发明专利技术首先计算本帧信号的梅尔倒谱系数,同时预测本帧信号的基音周期,然后使用梅尔倒谱系数来检测本帧信号是否存在噪声,若存在噪声,则使用基音周期预测值来重建本帧信号。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了,属于信号处理
。本专利技术首先计算本帧信号的梅尔倒谱系数,同时预测本帧信号的基音周期,然后使用梅尔倒谱系数来检测本帧信号是否存在噪声,若存在噪声,则使用基音周期预测值来重建本帧信号。【专利说明】
本专利技术涉及,属于信号处理

技术介绍
音频信号中的瞬态加性噪声,也称为暂态噪声,或脉冲噪声。通常,瞬态噪声在时域中是非连续、间歇、脉冲式的,噪声能量主要集中在较短的时间区间内,在该区间内瞬态噪声的能量比纯净信号的能量要明显大很多。典型的瞬态噪声如桌子敲击声、关门声、鼓掌声、键盘击键声、鼠标按键声、锤子击打声等,它们常出现在很多应用场合,如助听器、手机、视讯会议设备等。瞬态噪声的存在严重影响音频质量,因此,有必要采取措施对瞬态噪声进行抑制,以增强音频的质量。目前的噪声抑制算法大多是针对稳态噪声和连续噪声情况,通常使用文献《语音增强及其相关技术的研究》中所述方法进行语音增强,如谱减法、自适应滤波法等,但是这些算法对上述瞬态噪声却无能为力,基本没有抑制效果。
技术实现思路
本专利技术针对以上问题的提出,而研制。本专利技术采取的技术方案为:首先计算本帧信号的梅尔倒谱系数,同时预测本帧信号的基音周期,然后使用梅尔倒谱系数来检测本帧信号是否存在噪声即进行噪声检测,若存在噪声,则使用基音周期预测值来进行波形重建。本专利技术的有益效果:使用20首纯净语音音频(包含成年男子、成年女子、儿童语音音频)与4种类型的噪声音频进行实验,噪声类型分别为:鼠标声、敲击声、节拍器声、键盘声。四种噪声的持续时间分别为 :鼠标声为10ms,敲击声、节拍器声为20ms,键盘声为30ms。对每首纯净音频分别加入这4种噪声,得到80首含噪音频。每首音频加入噪声的个数为30个,噪声之间的距离相等。所有音频的采样率为fs=48kHz,帧长为N=480。MFCC计算阶段,做NFFT=1024点FFT,梅尔滤波器组的滤波器个数为M=24,求取L=12维MFCC ;瞬态噪声检测阶段,自适应门限设置为Thres=Const.ener,为使门限适合所有噪声,常数const设置为10, ener为每一巾贞输入信号的能量,最小值设置为60.0 ;门限更新时,遗忘因子b设置为0.4 ;基音周期估计阶段,在(2ms,12ms)内搜索基音周期,对应点数为(76,576);波形重建阶段,淡入淡出点数N1, N2均为32,缓冲区buf (η)长度为2240。使用本专利技术对含噪语音进行去噪后,大幅度提高了语音的可懂度,减少了听者的疲劳感。使用分段信噪比SNRs?和PEAQ两种指标对本方法去噪效果进行评估结果见【专利附图】【附图说明】里的图12与图13所示。【专利附图】【附图说明】图1梅尔频率与线性频率的关系。图2现有技术一的技术方案流程。图3现有技术二的技术方案流程。图4本技术方案框图。图5MFCC特征提取框图。图6梅尔频率滤波器组。图7基音周期估计框图。图8两点间的线性插值。图9(a)当前帧未修复时信号。图9 (b)新基音周期波形pw(p) (η)。图9(c)当前帧修复后信号。图10(a)当前帧未修复时信号。图10(b)当前帧信号。图10(c)修复后信号。图11(a)去噪前信号。图11(b)去噪后信号。图12去噪效果评估表(SNR)。图13去噪效果评 估(PEAQ)。 【具体实施方式】下面结合附图对本专利技术做进一步说明:梅尔倒谱系数:对人的听觉机理的研究发现,人耳对不同频率的声波具有不同的听觉灵敏度,且在200Hz到5kHz之间的语音信号对语音的清晰度影响最大。此外,人耳具有掩蔽效应,即能量大的语音信号对较弱的语音信号具有一定的掩盖作用。通常,较低频率的音频掩蔽较高频率的音频容易,反之则比较困难,也就是说,在低频处的声音掩蔽的临界带宽较高频端要小。据此,人们按照临界带宽的大小由密到稀安排一组带通滤波器,对输入信号进行滤波。如果将每个带通滤波器输出信号的能量作为信号的基本特征,则对此特征进一步处理后,就可作为语音的特征,这就是梅尔倒谱系数(MFCC)。这种特征不依赖于信号的性质,即对输入信号不做任何假设和限制,同时又利用了人耳的听觉感知特性,因此,与基于声道模型的线性预测倒谱系数(LPCC)相比,它具有更好的鲁棒性,且当信噪比较低时,仍具有较好的语音识别性能。MFCC是在梅尔标度频率域提取出来的倒谱参数。梅尔标度描述了人耳频率的非线性特性,它与频率的关系可近似表示为fmel = 2595 1gl0 (I+)(18)式中,f为频率,单位为Hz。图1所示即为梅尔频率与线性频率的关系,随着flinem的线性增长,ffflel对数的形式增长。信包丢失隐藏:在基于IP协议的语音通信系统,比如基于IP网的语音(VoIP)中,由于网络拥塞或者传输过程延迟抖动,会造成信包丢失,即某些信包不能按时出现在接收端,严重影响接收端的语音质量。因此,在接收端必须采取一些措施,以减少因信包丢失而造成的语音失真。通常,这种处理丢包问题的措施称为信包丢失隐藏算法(PLC)算法。PLC算法主要分为基于发送端的处理算法和基于接收端的处理算法两类。基于发送端PLC算法由收、发两端共同参与完成;基于收端PLC算法,则仅根据接收端正常接收到的信包、丢失信包编号以及预先知道的编码方式,尽可能恢复出原来的语音。由于基于接收端的PLC技术不需要发送端的有关数据,因此不会增加网络的流量和时延。常用的基于接收端的PLC方法有静音替代方法、前一信包重复方法、模板匹配方法、基音波形复制方法和线性预测方法等。本文提出的基音周期波形复制(PWR)方法,属于基于接收端的PLC方法。与本专利技术相关的现有技术一现有技术一的技术方案何志勇等在论文“脉冲噪声环境下基于卡尔曼滤波的语音增强”中,提出了一种瞬态噪声环境下的语音增强方法。该方法的流程图如图2所示,首先找出瞬态噪声样本能量与含噪信号样本能量之比最大的频段,然后利用该频段的能量分布情况,逐帧判别语音信号是否被瞬态噪声干扰;在此基础上,该方法针对瞬态噪声干扰的语音帧,应用卡尔曼滤波算法进行去噪;此外,该方法对自回归(AR)模型参数估计过程进行了改进。现有技术一的缺点(I)对于拖尾较长的噪声,拖尾部分有可能检测不出来。(2)在去噪时,所用的卡尔曼滤波适合对稳态噪声进行去噪,不适合非平稳的瞬态噪声,因此去噪效果有限,噪声残留较多,影响了语音质量。与本专利技术相关的现有技术二现有技术二的技术方案Hetherington等在专利技术专利“Repetitive transient noise removal”中,提出一种瞬态噪声抑制方法。Hetherington方法的流程图如图3所示。该方法先根据噪声特点进行建模,然后利用建模信号与待检测信号的相关系数来确定待检测数据是否含有噪声,若存在噪声,则根据建模信号将待检测信号中的噪声成分移除。现有技术二的缺点Hetherington方法可有效地对重复出现的噪声进行去噪,但由于瞬态噪声类型多种多样,当短时间内存在多种不同类型的瞬态噪声时,会造成建模不准确,此时Hetherington方法的去噪效果较差。本专利技术技术方案的详细阐述本专利技术所要解决的技术问题对瞬态噪声干扰的音频进行语音增强,抑制瞬态噪声,改进语音质量,提高音频可懂本文档来自技高网...

【技术保护点】
瞬态噪声的去噪方法,其特征在于:首先计算本帧信号的梅尔倒谱系数,同时预测本帧信号的基音周期,然后使用梅尔倒谱系数来检测本帧信号是否存在噪声即进行噪声检测,若存在噪声,则使用基音周期预测值来进行波形重建。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈喆殷福亮周文颖
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利