The invention provides a target speech signal enhancement method, system and storage medium based on continuous noise tracking. The target speech signal enhancement method includes: step 1: receiving noisy speech signal, processing noisy speech signal by frame windowing, using short-time Fourier transform to obtain time-frequency relationship; step 2: estimating noise power spectrum; step 3: voice. Estimation of power spectrum; Step 4: Estimation of speech signal by speech estimator; Step 5: Reverse Fourier transform, windowing and overlapping summation technology to achieve speech recovery. The beneficial effect of the present invention is that the target speech signal is effectively separated, the residual noise in the speech signal is greatly reduced, and the quality of the target signal is greatly improved. It plays an important role in automatic speech recognition, speaker recognition, human-computer interface and hearing aids.
【技术实现步骤摘要】
基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质
本专利技术涉及语音处理
,尤其涉及基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质。
技术介绍
生活中处处存在着噪声,语音增强算法的目的在于提高被噪声污染的目标语音信号的质量和可懂度。现有的语音增强算法通常采用语音活动检测器来估计背景噪声进而实现目标信号增强,这些算法在平稳噪声环境以及高信噪比条件下表现的良好。然而,当在低信噪比特别是在非平稳噪声环境下,这些算法的性能表现地非常有限。由于生活中的噪声比较复杂,例如汽车,火车通过,行人说话聊天都会产生各种噪声,开发一种能在非平稳噪声条件下很好工作的语音增强算法是非常有必要的。
技术实现思路
本专利技术提供了一种基于连续噪声跟踪的目标语音信号增强方法,包括如下步骤:步骤1:接收带噪语音信号,对带噪语音信号进行分帧加窗处理,然后使用短时傅里叶变换得到时频域的关系;步骤2:对噪声功率谱进行估计;步骤3:纯净语音功率谱的估计;步骤4:通过语音估计器对纯净语音信号进行估计,对于语音估计器的先验信噪比,利用判决引导算法估计器来实现;步骤5:反傅里叶变换,加窗并使用交叠相加技术实现纯净语音恢复。作为本专利技术的进一步改进,在所述步骤2中,使用噪声功率的最小均方误差估计器来对噪声功率谱进行估计。作为本专利技术的进一步改进,在所述步骤3中,使用基于语音存在概率的最小均方误差估计器来实现语音功率谱的计算。作为本专利技术的进一步改进,在所述步骤4中,运用基于广义伽马的先验概率模型得到最小均方误差语音增强算法。本专利技术还提供了一种基于连续噪声跟踪的目标语音信号增强系统 ...
【技术保护点】
1.一种基于连续噪声跟踪的目标语音信号增强方法,其特征在于,包括如下步骤:步骤1:接收带噪语音信号,对带噪语音信号进行分帧加窗处理,然后使用短时傅里叶变换得到时频域的关系;步骤2:对噪声功率谱进行估计;步骤3:纯净语音功率谱的估计;步骤4:通过语音估计器对纯净语音信号进行估计,对于语音估计器的先验信噪比,利用判决引导算法估计器来实现;步骤5:反傅里叶变换,加窗并使用交叠相加技术实现纯净语音恢复。
【技术特征摘要】
1.一种基于连续噪声跟踪的目标语音信号增强方法,其特征在于,包括如下步骤:步骤1:接收带噪语音信号,对带噪语音信号进行分帧加窗处理,然后使用短时傅里叶变换得到时频域的关系;步骤2:对噪声功率谱进行估计;步骤3:纯净语音功率谱的估计;步骤4:通过语音估计器对纯净语音信号进行估计,对于语音估计器的先验信噪比,利用判决引导算法估计器来实现;步骤5:反傅里叶变换,加窗并使用交叠相加技术实现纯净语音恢复。2.根据权利要求1所述的目标语音信号增强方法,其特征在于,在所述步骤2中,使用噪声功率的最小均方误差估计器来对噪声功率谱进行估计。3.根据权利要求2所述的目标语音信号增强方法,其特征在于,在所述步骤2中,利用贝叶斯准则,能得到最小均方误差估计器,式子如下在公式(1)中,n(N)代表噪声谱变量,θ代表噪声短时傅里叶变换系数的角度,由于纯净语音与噪声的傅里叶系数被假定为服从高斯分布的,我们可以得到在公式(2)中,n(N)代表噪声谱变量,λd代表噪声功率谱密度,其中λx代表语音功率谱密度,通过推导我们得到其中ξ=λx/λd...
【专利技术属性】
技术研发人员:张啟权,王明江,陆云,韩宇菲,张禄,孙凤娇,
申请(专利权)人:哈尔滨工业大学深圳,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。