基于语音重建的瞬态噪声抑制方法技术

技术编号:11437519 阅读:101 留言:0更新日期:2015-05-08 15:38
一种基于语音重建的瞬态噪声抑制方法,涉及音频处理技术领域,所解决的是抑制瞬态噪声的技术问题。该方法通过瞬态噪声检测和瞬态噪声抑制两个部分,消除瞬态噪声的影响;首先,利用传统方法去除信号中的平稳态噪声,并基于白化后语音信号和瞬态噪声信号不同的分布特性对瞬态噪声进行检测;其次,检测出瞬态噪声后,提出基于语音信号重建的算法对瞬态噪声进行抑制,将含有瞬态噪声的帧丢弃,利用前后相邻的未受干扰的信号进行波形重建,替换掉原有的信号,从而在没有明显语音失真的情况下完全地消除瞬态噪声。本发明专利技术提供的方法,适用处理含有瞬态噪声的语音信号。

【技术实现步骤摘要】
基于语音重建的瞬态噪声抑制方法
本专利技术涉及音频处理技术,特别是涉及一种基于语音重建的瞬态噪声抑制方法的技术。
技术介绍
在手机、助听器、免提电话等语音通讯终端设备中,瞬态噪声如键盘声、鼠标声以及敲击声等会严重影响语音质量和音频品质,因此必须进行相应的检测和抑制。瞬态噪声是一种加性噪声,属于强非平稳态噪声,典型的瞬态噪声是一段突发脉冲式的信号,并伴随持续时间10-50ms的衰减振荡过程,由于其频带较宽,与语音信号在时频域有较多重叠,且具有非连续性的特点,因此传统的单通道和多通道语音增强方法都不能很好地抑制瞬态噪声,还可能引入失真。近年来,国内外研究者提出了一些用于瞬态噪声抑制的方法,Talmon等提出了一类瞬态噪声抑制方法,通过采用非局部(Non-local,NL)扩散滤波器和最优改进对数谱幅度估计算法(Optimally-Modified-LogSpectral-Amplitude,OM-LSA)。Zheng等在时域、频率域和小波域等提出了一些基于变化域的瞬态噪声检测及抑制方法。这些方法主要通过学习瞬态噪声的特性,以实现瞬态噪声的检测,最终实现瞬态噪声的抑制。但是此类方法存在时延和噪声残留,并且只适用于部分类型的瞬态噪声,因此在实时语音通信系统应用中不具普遍适用性,而且由于人耳的听觉特性,对残留的瞬态噪声异常敏感,现有的方法都无法完全地消除瞬态噪声。
技术实现思路
针对上述现有技术中存在的缺陷,本专利技术所要解决的技术问题是提供一种能有效地抑制瞬态噪声,在语音信号和瞬态噪声同时存在时能完全地消除瞬态噪声的基于语音重建的瞬态噪声抑制方法。为了解决上述技术问题,本专利技术所提供的一种基于语音重建的瞬态噪声抑制方法,其特征在于,具体步骤如下:1)利用传声器拾取声信号,并对传声器所拾取的声信号进行预处理,忽略其中的平稳态噪声残留ds(n),得到预处理后的声信号为:x(n)=s(n)+dt(n);其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(n)为预处理后的声信号中的瞬态噪声成分;2)对x(n)进行分帧、预白化处理,基于预白化后浊音和瞬态噪声的波形分布特性差异,对x(n)逐帧检测是否含有瞬态噪声;3)对x(n)进行重建,瞬态噪声与语音信号同时存在时,将x(n)中包含有瞬态噪声的帧丢弃,或将x(n)中包含有瞬态噪声的帧及其后的2-3帧一并舍弃,再利用去除帧的前后相邻的未受干扰帧进行波形重建,替换掉原有的信号。进一步的,所述步骤2)中,对x(n)逐帧检测是否含有瞬态噪声的步骤如下:2.1)对x(n)进行分帧、预白化处理,得到x(n)的白化信号,将x(n)的白化信号中的各帧信号记为:其中,为x(n)的白化信号中的第l帧信号的第k个样本点,x(k,l)为原始信号进行分帧处理后的第l帧信号的第k个样本点,P为线性预测的阶数,为第l帧信号的线性预测系数,x(k-p,l)为原始信号进行分帧处理后的第l帧信号的第k-p个样本点;2.2)加入窗函数计算x(n)的白化信号各帧的重心,具体计算公式为:其中,C(l)为x(n)的白化信号第l帧的重心,w(k)为汉宁窗,N为x(n)的白化信号中每帧的采样点数量;2.3)以C(l)为中心,计算包含E%能量所需的时间长度B(l),具体计算公式为:其中,是指取能使成立的v的最小取值,E%=90%;2.4)根据B(l)值判断信号中是否存在瞬态噪声,如果B(l)<thr,则判定信号中存在瞬态噪声,thr为预先设定的瞬态噪声判断门限。进一步的,所述步骤2.2)中,N=512。进一步的,所述步骤2.4)中,thr=150。进一步的,所述步骤3)中,对x(n)进行重建的步骤如下:3.1)利用基音周期检测方法对丢弃帧之前的封包进行基音周期检测,得到的前向基音周期Pf,对丢弃帧之后的封包进行基音周期检测,得到后向基音周期Pb,并确定丢弃帧前一封包的周期波形及后一封包的周期波形;对于x(n)中的丢弃帧,对这些丢弃帧之前的封包与之后的封包进行基音检测,并判断是否为浊音,如果前后帧都是浊音,则转至步骤3.2),反之则转至步骤3.3);3.2)在丢弃帧的前、后封包均为浊音的情况下,先对前、后封包的周期波形进行相位同步,再根据丢弃帧长度确定该丢弃帧所需的重建周期波形个数及各重建周期波形长度,然后进行周期波形内差重建语音,具体重建方法如下:3.2.1)在丢弃帧前向封包中,选择与丢弃帧最近的Pf个数据作为丢弃帧的前向周期波形PPW,在丢弃帧的后向封包中,选择与丢弃帧最近的Pb个数据作为丢弃帧的后向周期波形NPW,则丢弃帧所需的重建波形周期数量为:其中,Np为丢弃帧所需的重建波形周期数量,round()为四舍五入函数,r为所有需要重建的数据点数量;3.2.2)计算各个重建波形周期的长度,具体计算公式为:其中,Pi为第i个重建波形周期的长度;如果各重建波形周期的长度之和与r的值有偏差,则对各重建波形周期的长度进行修正,将各重建波形周期的长度之和修正为与r值一致;3.2.3)对各个重建波形周期采用内插法修正,修正方法如下:3.2.3.1)对丢弃帧的各个前向周期波形、后向周期波形进行延展或压缩,使得它们与长度与对应的重建波形周期的长度相同;3.2.3.2)对修正后的前向周期修正波形、后向周期修正波形进行加权计算,具体计算公式为:其中,RPWi(k)为重建信号在第i个周期波形中第k个样本点的数值,为前向周期修正波形在重建信号中第i个周期波形中第k个样本点对应的数值,为后向周期修正波形在重建信号中第i个周期波形中第k个样本点对应的数值,r为丢弃帧的长度,g为需重建的RPW样本点在丢弃帧中的位置;3.2.4)将各个按顺序相连,得到最后的重建波形;3.3)在丢弃帧的前、后封包中至少有一个不是浊音的情况下,采用延拓和加权方式重建语音;3.3.1)如果丢弃帧的前一帧是浊音,且后一帧不是浊音,则将浊音段向后进行周期延拓,直至充满整个丢失帧,得到延拓波形PPW(k),浊音段延拓周期为Pf,将非浊音段向前进行周期延拓,直至充满整个丢失帧,得到延拓波形NPW(k),非浊音段延拓周期为固定值,这里设为一帧的长度,其中的k为重建波形中的第k个样本点,再根据延拓波形PPW(k)、NPW(k)重建丢弃帧波形,重建的丢弃帧波形为:RPW(k)=wf(k)·PPW(k)+wb(k)·NPW(k)k=1,2,3...r如果则,wb(k)=0,反之则其中,RPW(k)为重建的丢弃帧波形中的第k个样本点的数值;如果丢弃帧的后一帧是浊音,且前一帧不是浊音,则将浊音段向前进行周期延拓,直至充满整个丢失帧,得到延拓波形NPW(k),浊音段延拓周期为Pb,将非浊音段向后进行周期延拓,直至充满整个丢失帧,得到延拓波形PPW(k),延拓周期为固定值,这里设为一帧的长度,其中的k为重建波形中的第k个样本点,再根据延拓波形PPW(k)、NPW(k)重建丢弃帧波形,重建的丢弃帧波形为:RPW(k)=wf(k)·PPW(k)+wb(k)·NPW(k)k=1,2,3...r如果则,反之则wf(k)=0;其中,RPW(k)为重建的丢弃帧波形中的第k个样本点的数值;如果丢弃帧的前后帧都不是浊音,则将前帧封包向后进行周期延拓,直至充满整个丢失帧,得到延拓本文档来自技高网...
基于语音重建的瞬态噪声抑制方法

【技术保护点】
一种基于语音重建的瞬态噪声抑制方法,其特征在于,具体步骤如下:1)利用传声器拾取声信号,并对传声器所拾取的声信号进行预处理,忽略其中的平稳态噪声残留ds(n),得到预处理后的声信号为:x(n)=s(n)+dt(n);其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(n)为预处理后的声信号中的瞬态噪声成分;2)对x(n)进行分帧、预白化处理,基于预白化后浊音和瞬态噪声的波形分布特性差异,对x(n)逐帧检测是否含有瞬态噪声;3)对x(n)进行重建,瞬态噪声与语音信号同时存在时,将x(n)中包含有瞬态噪声的帧丢弃,或将x(n)中包含有瞬态噪声的帧及其后的2‑3帧一并舍弃,再利用去除帧的前后相邻的未受干扰帧进行波形重建,替换掉原有的信号。

【技术特征摘要】
1.一种基于语音重建的瞬态噪声抑制方法,其特征在于,具体步骤如下:1)利用传声器拾取声信号,并对传声器所拾取的声信号进行预处理,忽略其中的平稳态噪声残留ds(n),得到预处理后的声信号为:x(n)=s(n)+dt(n);其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(n)为预处理后的声信号中的瞬态噪声成分;2)对x(n)进行分帧、预白化处理,基于预白化后浊音和瞬态噪声的波形分布特性差异,对x(n)逐帧检测是否含有瞬态噪声;3)对x(n)进行重建,瞬态噪声与语音信号同时存在时,将x(n)中包含有瞬态噪声的帧丢弃,或将x(n)中包含有瞬态噪声的帧及其后的2-3帧一并舍弃,再利用去除帧的前后相邻的未受干扰帧进行波形重建,替换掉原有的信号。2.根据权利要求1所述的基于语音重建的瞬态噪声抑制方法,其特征在于,所述步骤2)中,对x(n)逐帧检测是否含有瞬态噪声的步骤如下:2.1)对x(n)进行分帧、预白化处理,得到x(n)的白化信号,将x(n)的白化信号中的各帧信号记为:其中,为x(n)的白化信号中的第l帧信号的第k个样本点,x(k,l)为原始信号进行分帧处理后的第l帧信号的第k个样本点,P为线性预测的阶数,为第l帧信号的线性预测系数,x(k-p,l)为原始信号进行分帧处理后的第l帧信号的第k-p个样本点;2.2)加入窗函数计算x(n)的白化信号各帧的重心,具体计算公式为:其中,C(l)为x(n)的白化信号第l帧的重心,w(k)为汉宁窗,N为x(n)的白化信号中每帧的采样点数量;2.3)以C(l)为中心,计算包含E%能量所需的时间长度B(l),具体计算公式为:其中,是指取能使成立的v的最小取值,E%=90%;2.4)根据B(l)值判断信号中是否存在瞬态噪声,如果B(l)<thr,则判定信号中存在瞬态噪声,thr为预先设定的瞬态噪声判断门限。3.根据权利要求2所述的基于语音重建的瞬态噪声抑制方法,其特征在于,所述步骤2.2)中,N=512。4.根据权利要求2所述的基于语音重建的瞬态噪声抑制方法,其特征在于,所述步骤2.4)中,thr=150。5.根据权利要求1所述的基于语音重建的瞬态噪声抑制方法,其特征在于,所述步骤3)中,对x(n)进行重建的步骤如下:3.1)利用基音周期检测方法对丢弃帧之前的封包进行基音周期检测,得到的前向基音周期Pf,对丢弃帧之后的封包进行基音周期检测,得到后向基音周期Pb,并确定丢弃帧前一封包的周期波形及后一封包的周期波形;对于x(n)中的丢弃帧,对这些丢弃帧之前的封包与之后的封包进行基音检测,并判断是否为浊音,如果前后帧都是浊音,则转至步骤3.2),反之则转至步骤3.3);3.2)在丢弃帧的前、后封包均为浊音的情况下,先对前、后封包的周期波形进行相位同步,再根据丢弃帧长度确定该丢弃帧所需的重建周期波形个数及各重建周期波形长度,然后进行周期波形内差重建语音,具体重建方法如下:3.2.1)在丢弃帧前向封包中,选择与丢弃帧最近的Pf个数据作为丢弃帧的前向周期波形PPW,在丢弃帧的后向封包中,选择与丢弃帧最近的Pb个数据作为丢弃帧的后向周期波形NPW,则丢弃帧所需的重建波形周期数量为:其中,Np为丢弃帧所需的重建波形周期数量,round()为四舍五入函数,r为所有需要重建的数据点数量;3.2.2)计算各个重建波形周期的长度,具体计算公式为:其中,Pi为第i个重建波形周期的长度;如果各重建波形周期的长度之和与r的值有偏差,则对各重建波形周期的长度进行修正,将各重建波形周期的长度之和修正为与r值一致;3.2.3)对各个重建波形周期采用内插法修正,修正方法如下:3.2.3.1)对丢弃帧的各个前向周期波形、后向周期波形进行延展或压缩,使得它们与长度与对应的重建波形周期的长度相同;3.2.3.2)对修正后的前向周期修正波形、后向周期修正波形进行加权计算,具体计算公式为:其中,RPWi(...

【专利技术属性】
技术研发人员:厉剑郑成诗李晓东杨鹤飞
申请(专利权)人:中国科学院上海高等研究院中国科学院声学研究所
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1