数字语音信号的去噪声方法技术

技术编号：3047482 阅读：328 留言：0更新日期：2012-04-11 18:40

为了用相继帧处理去掉数字语音信号的噪声：计算每一帧的信号的频谱分量（Ｓ↓［ｎ，ｆ］，Ｓ↓［ｎ，ｉ］），计算含在语音信号中的噪声的频谱分量的最大估计（＊′↓［ｎ，ｉ］）；为了估计基波频率而进行信号的谐波分析；进行减谱，其中至少有一步是分别从这个帧的语音信号的每个频谱分量（Ｓ↓［ｎ，ｆ］）中减去由一些参量所决定的一个量值，述及的参量中包括噪声的对应的频谱分量的最大估计和估计得到的基波频率；以及对减谱的结果进行向时域的变换，以便构建去噪声的语音信号（Ｓ↑［３］）。（*该技术在2018年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及的是语音信号的去噪声的数字技术，特别涉及的是用消除非线谱来去噪声。由于新的通信方式，特别是移动电话通信，的普遍化，各种通信越来越在强噪声环境中进行。附加在语音上的噪声防碍语音信号的优化压缩，产生非本征的背景噪声，就会干扰通信。另一方面噪声还使语音信息难以理解。为了试图减小噪声在通信中的作用，已经研究了多种算法。S.F.Boll(在文章“Suppression of acoustic noise in speech using spectralsustraction”IEEE Trans.on Acoustics，speech and Signal Processing，Vol.ASSP-27，n°2 arril(四月)1999)曾推荐以减谱为基础的一种算法。这种技术在于在无声阶段(phase de silence)估计噪声谱，并将之从接收到的信号中减去。这可降低接收到的噪声电平，但其主要缺陷是要建立一个特别令人讨厌的音乐噪声，因为它是非自然的。D.B.Paul(“The Spectral enveloppe estimation Vocoder”，IEEE Trans.on Acoustics，Speech and Signal Processing，Vol.ASSP-29，n°4 aot(八月)1981)和P.Lockwood et J.Boudy(“Experiment with a nonlinear spectral subtraetor(NSS)，HiddenMarkov Model and the projection，f...

【技术保护点】
一种采用相继帧处理的数字语音信号（ｓ）的去噪声方法，其中：－对语音信号进行谐波分析，以对具有声音活动性的每一帧估计出语音信号的基波频率（ｆ↓［ｐ］）；－对于每一帧，计算语音信号的频谱分量（Ｓ↓［ｎ，ｆ］，Ｓ↓［ｎ，ｉ］）；－对于每一帧，计算含杂在语音信号中的噪声的频谱分量的估计；－进行减谱，其中至少有一步是对于一帧从所述帧的语音信号的每个频谱分量（Ｓ↓［ｎ，ｆ］）中减去由一些参量所决定的一个量值，在述及的参量中，至少有述及的帧的噪声所对应的频率分量的估计和估计得到的基波频率的值；以及－对减谱得到的结果应用于时间域的一个变换，以构建去了噪声的语音信号（ｓ↑［３］）。

【技术特征摘要】
FR 1997-9-18 97/116421.一种采用相继帧处理的数字语音信号(s)的去噪声方法，其中-对语音信号进行谐波分析，以对具有声音活动性的每一帧估计出语音信号的基波频率(fp)；-对于每一帧，计算语音信号的频谱分量(Sn，f，Sn，i)；-对于每一帧，计算含杂在语音信号中的噪声的频谱分量的估计；-进行减谱，其中至少有一步是对于一帧从所述帧的语音信号的每个频谱分量(Sn，f)中减去由一些参量所决定的一个量值，在述及的参量中，至少有述及的帧的噪声所对应的频率分量的估计和估计得到的基波频率的值；以及-对减谱得到的结果应用于时间域的一个变换，以构建去了噪声的语音信号(s3)。2.根据权利要求1的方法，其中，将一个估计得到的基波频率的值(fp)用来在要计算语音信号的频谱分量选择受保护的频率，且在这个方法中对于从语音信号中的给定的频谱分量(Sn，f)减去的量值，如果述及的频谱分量对应于要保护的频率，则所采用的量值就小于述及的频谱分量不对应于要保护的频率时所采用的量值。3.根据权利要求2的方法，其中，选择要保护的频率，使得对应于受保护的频率的语音信号的频谱分量超过根据对应的噪声的频率分量的估计所确定的噪声音级。4.根据权利要求2或3的方法，其中，每个受保护的频率是在计算语音信号的频谱分量的频率集合中最接近估计得到的基波频率(fp)的一个整倍数的频率。5.根据权利要求2或3的方法，其中，每个受保护的频率是在计算语音信号的频谱分量的那些频率的集合中最接近于形式为[η×fp-η×δfp/2，η×fp+η×δfp/2]的间隔的一个频率，其中fp表示估计得到的基波频率，δfp为基波频率的估计的频率分辨能力，而η表示一个整数，且在这个方法中，6.根据权利要求2至5中任意一项的方法，其中，从语音信号频谱分量(Sn，f)中减去的量值在受保护频率处基本上为零。7.根据权利要求1至6中任意一项的方法，其中，在对一帧中的语音信号的基波频率(fp)估计之后，通过对估计的基波频率的整倍数的附加取样频率(fe)进行附加取样，来限定这帧的语音信号，并对于这帧，在给定的信号(s′)的基础上计算语音信号的频谱分量(Sn，f)，用来从中减去述及的量值。8.根据权利要求7的方法，其中，将由N个样本的组所给出的信号(s′)变换到频域上，计算语音信号的频谱分量(Sn，f)，而且，在这个方法中，附加取样频率(fe)和估计得到的基波频率的比(p)是整数N。9.根据权利要求7或8的方法，其中，根据在给定的信号的基础上计算的频谱分量的自相关的熵(H)，由这个计算估计这一帧的语音信号的噪声音级(χ)。10.根据权利要求9的方法，其中，述及的计算自相关(H)的频谱分量(S2n，f)都是在减去述及的量值之后，在给定的信号(s′)基础上计算的那些频谱分量。11.根据权利要求9或10的方法，其中，述及的噪声音级(χ)的测量是根据下面形式的归一化的熵(H)进行的H=Σk=0N/2-1A(k).log[A(k)]log(N/2)]]>此处，N是用于在给定的信号(s′)的基础上计算各频谱分量(Sn，f)的样本数，而A(k)是归一化的自相关，由下式定义A(k)=Σf=0N/2-1Sn,f2·Sn,f+k2Σf=0N/2-1Σf′=0N/2-1Sn,f2·Sn,f+f′2]]>S2n，f表示在给定的信号基础上计算的顺序(rang)为f的频谱分量。12.根据前面各权利要求中的任意一项的方法，其中，在每一帧的处理之后，在由这个处理所提供的去噪声的语音信号的所有样本中，保留的样本的数目(M)等于取样频率(Fe)和估计得到的基波频率(fp)的比(Tp)的整数倍。13. ...

【专利技术属性】
技术研发人员：菲利普洛克伍德，斯特凡鲁比阿兹，
申请(专利权)人：伊兹安全防卫网络公司，
类型：发明
国别省市：FR[法国]

全部详细技术资料下载我是这个专利的主人