一种基于Kullback-Leibler差异的语音增强方法技术

技术编号：20366657 阅读：25 留言：0更新日期：2019-02-16 18:15

本发明专利技术公开了一种基于Kullback‑Leibler(KL)差异的语音增强方法并且确定该方法的最佳分解次数：具体是先将含噪语音信号做分帧处理，并对每一帧信号分别处理，利用KL差异原理选出最佳原子

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Kullback-Leibler差异的语音增强方法
本专利技术涉及一种基于Kullback-Leibler(KL)差异的语音增强方法，应用于无线电话通信、场景录音和军事窃听等

技术介绍
语音信号处理的目的是要得到某些语音特征参数以便高效的传输或存储，或者是通过某种处理运算可以达到某种用途的要求，例如人工语音合成、辨别出讲话者，讲话的内容等。语音增强是语音信号处理的一个重要方面。语音增强的一个主要目的是从混杂着噪声的语音信号中尽可能地提取出纯净的原始语音信号，然而，由于在通常情况下干扰都是随机的，从混杂着噪声的语音信号中提取出完全纯净的语音信号几乎是不可能的，尤其是在低信噪比的情况下更是十分困难。在这种情况下，语音增强的目的主要有两个：一是改进语音质量，消除背景噪声，使听者乐于接受；二是，提高语音的可懂度，使说话人易于辨识。近年来语音增强算法层出不穷，也得到了普遍的应用。这些方法主要是利用语音信号的某些特性，对其参数进行相关处理以达到消除噪声，逼近纯净语音信号的功能。现有已经提出来的语音增强方法主要包括：傅里叶变换及在其基础上衍生出来的短时傅里叶变换、小波变换。传统的傅里叶变换去噪方法是将一个信号分离为无穷多正弦信号的叠加。它将含有噪声的语音信号从时域变换到频域，然后对频域信号进行相关处理，用滤波器将噪声信号的频率进行滤除，保留剩余成分，然后对其做傅里叶逆变换便得到降噪后的语音信号。但是傅里叶变换对信号的要求十分严格，通常它只能对线性平稳的信号有较好的处理效果，而语音信号一般都是非线性和非平稳的，因此得不到理想的降噪效果。为了克服傅里叶变换...

【技术保护点】
1.一种基于Kullback‑Leibler差异的语音增强方法，其特征在于，包括以下步骤：1)、对含有噪声的语音信号进行分帧，将每一帧信号看作稳态信号；2)、对处理后的每一帧语音信号分别进行分析处理，利用KL差异选择原理依次选出最佳的原子a1,a2,...ak，用选出的最佳原子计算有理正交基函数Bk，然后用权重系数与该基函数组合得到增强后的重构信号；3)、将N次分解后得到的重构信号叠加得到增强后的纯净语音信号；4)、根据代价函数得到最佳分解次数。

【技术特征摘要】
2018.03.30 CN 20181029680491.一种基于Kullback-Leibler差异的语音增强方法，其特征在于，包括以下步骤：1)、对含有噪声的语音信号进行分帧，将每一帧信号看作稳态信号；2)、对处理后的每一帧语音信号分别进行分析处理，利用KL差异选择原理依次选出最佳的原子a1,a2,...ak，用选出的最佳原子计算有理正交基函数Bk，然后用权重系数与该基函数组合得到增强后的重构信号；3)、将N次分解后得到的重构信号叠加得到增强后的纯净语音信号；4)、根据代价函数得到最佳分解次数。2.根据权利要求1所述的基于Kullback-Leibler差异的语音增强方法，其特征在于，上述步骤1)中所述的对含有噪声的语音信号进行分帧，每一帧信号的长度为20～30ms，将该区间内的信号看作稳态信号。3.根据权利要求1所述的基于Kullback-Leibler差异的语音增强方法，其特征在于，上述步骤2)中所述的根据KL差异选择原则选出最佳原子并重构每次分解的增强信号，具体步骤如下：对于含有噪声的原始语音信号f(t)表示为如下形式：f(t)＝s(t)+n(t)(1)其中，s(t)为纯净语音信号，即需要重构得到的信号，n(t)为噪声信号，以下用f替代f(t)；对于第一次分解，令f1＝f，分解后得到重构信号表示为：其中为点ak的L2单位模化了的核，ak为模小于1的原子，表示内积，z为单位圆的边界，其模为1；R1为第二阶标准误差，进一步写成：根据公式(2)和(4)，f2表示为：f2即作为第二次分解时的输入信号，并对f2重复上述分解过程得到重构信号：以此类推，经过第k次分解后，重构信号写为：其中Bk(z)即为有理正交基函数，表示为：从公式(7)和(8)看出，该分解算法的核心是选取最佳的原子ak；在每一次分解中，利用KL差异选择...

【专利技术属性】
技术研发人员：王慧，黄青华，张丽丽，柯晨光，
申请(专利权)人：上海大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人