基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质技术方案

技术编号：21226479 阅读：46 留言：0更新日期：2019-05-29 07:16

本发明专利技术提供了一种基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质，该目标语音信号增强方法包括：步骤1：接收带噪语音信号，对带噪语音信号进行分帧加窗处理，使用短时傅里叶变换得到时频域的关系；步骤2：对噪声功率谱进行估计；步骤3：语音功率谱的估计；步骤4：通过语音估计器对语音信号进行估计；步骤5：反傅里叶变换，加窗并使用交叠相加技术实现语音恢复。本发明专利技术的有益效果是：本发明专利技术有效地把目标语音信号分离出来，大大减小了语音信号中的噪声残余量，使得目标信号的质量大大提高。这对自动语音识别、说话人识别、人机对话接口以及助听器等应用有着非常重要的作用。

Augmentation Method, System and Storage Media of Target Speech Signal Based on Continuous Noise Tracking

The invention provides a target speech signal enhancement method, system and storage medium based on continuous noise tracking. The target speech signal enhancement method includes: step 1: receiving noisy speech signal, processing noisy speech signal by frame windowing, using short-time Fourier transform to obtain time-frequency relationship; step 2: estimating noise power spectrum; step 3: voice. Estimation of power spectrum; Step 4: Estimation of speech signal by speech estimator; Step 5: Reverse Fourier transform, windowing and overlapping summation technology to achieve speech recovery. The beneficial effect of the present invention is that the target speech signal is effectively separated, the residual noise in the speech signal is greatly reduced, and the quality of the target signal is greatly improved. It plays an important role in automatic speech recognition, speaker recognition, human-computer interface and hearing aids.

全部详细技术资料下载

【技术实现步骤摘要】
基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质
本专利技术涉及语音处理
，尤其涉及基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质。
技术介绍
生活中处处存在着噪声，语音增强算法的目的在于提高被噪声污染的目标语音信号的质量和可懂度。现有的语音增强算法通常采用语音活动检测器来估计背景噪声进而实现目标信号增强，这些算法在平稳噪声环境以及高信噪比条件下表现的良好。然而，当在低信噪比特别是在非平稳噪声环境下，这些算法的性能表现地非常有限。由于生活中的噪声比较复杂，例如汽车，火车通过，行人说话聊天都会产生各种噪声，开发一种能在非平稳噪声条件下很好工作的语音增强算法是非常有必要的。
技术实现思路
本专利技术提供了一种基于连续噪声跟踪的目标语音信号增强方法，包括如下步骤：步骤1：接收带噪语音信号，对带噪语音信号进行分帧加窗处理，然后使用短时傅里叶变换得到时频域的关系；步骤2：对噪声功率谱进行估计；步骤3：纯净语音功率谱的估计；步骤4：通过语音估计器对纯净语音信号进行估计，对于语音估计器的先验信噪比，利用判决引导算法估计器来实现；步骤5：反傅里叶变换，加窗并使用交叠相加技术实现纯净语音恢复。作为本专利技术的进一步改进，在所述步骤2中，使用噪声功率的最小均方误差估计器来对噪声功率谱进行估计。作为本专利技术的进一步改进，在所述步骤3中，使用基于语音存在概率的最小均方误差估计器来实现语音功率谱的计算。作为本专利技术的进一步改进，在所述步骤4中，运用基于广义伽马的先验概率模型得到最小均方误差语音增强算法。本专利技术还提供了一种基于连续噪声跟踪的目标语音信号增强系统...

【技术保护点】
1.一种基于连续噪声跟踪的目标语音信号增强方法，其特征在于，包括如下步骤：步骤1：接收带噪语音信号，对带噪语音信号进行分帧加窗处理，然后使用短时傅里叶变换得到时频域的关系；步骤2：对噪声功率谱进行估计；步骤3：纯净语音功率谱的估计；步骤4：通过语音估计器对纯净语音信号进行估计，对于语音估计器的先验信噪比，利用判决引导算法估计器来实现；步骤5：反傅里叶变换，加窗并使用交叠相加技术实现纯净语音恢复。

【技术特征摘要】
1.一种基于连续噪声跟踪的目标语音信号增强方法，其特征在于，包括如下步骤：步骤1：接收带噪语音信号，对带噪语音信号进行分帧加窗处理，然后使用短时傅里叶变换得到时频域的关系；步骤2：对噪声功率谱进行估计；步骤3：纯净语音功率谱的估计；步骤4：通过语音估计器对纯净语音信号进行估计，对于语音估计器的先验信噪比，利用判决引导算法估计器来实现；步骤5：反傅里叶变换，加窗并使用交叠相加技术实现纯净语音恢复。2.根据权利要求1所述的目标语音信号增强方法，其特征在于，在所述步骤2中，使用噪声功率的最小均方误差估计器来对噪声功率谱进行估计。3.根据权利要求2所述的目标语音信号增强方法，其特征在于，在所述步骤2中，利用贝叶斯准则，能得到最小均方误差估计器，式子如下在公式(1)中，n(N)代表噪声谱变量，θ代表噪声短时傅里叶变换系数的角度，由于纯净语音与噪声的傅里叶系数被假定为服从高斯分布的，我们可以得到在公式(2)中，n(N)代表噪声谱变量，λd代表噪声功率谱密度，其中λx代表语音功率谱密度，通过推导我们得到其中ξ＝λx/λd...

【专利技术属性】
技术研发人员：张啟权，王明江，陆云，韩宇菲，张禄，孙凤娇，
申请(专利权)人：哈尔滨工业大学深圳，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人