The invention discloses a speech enhancement method and system based on phase compensation. The method includes: acquiring the noisy speech signal to be processed; performing short-time Fourier transform on the noisy speech signal to obtain the amplitude spectrum and phase spectrum of the noisy speech signal; acquiring the phase spectrum compensation function, in which the compensation factor is a Sigmoid function corresponding to the change of the signal-to-noise ratio of the noisy speech; and according to the phase. The spectral compensation function compensates the phase spectrum of the noisy speech signal and obtains the compensated phase spectrum; obtains the amplitude of the pure speech signal according to the amplitude spectrum of the noisy speech signal; reconstructs the compensated phase spectrum with the amplitude of the pure speech signal to obtain the enhanced speech signal. Compared with the traditional speech enhancement method based on phase compensation, the method or system of the present invention can estimate the noise closer to the real noise power spectrum, effectively suppress the noise in the audio signal and improve the intelligibility of the speech signal while enhancing the quality of the speech signal.
【技术实现步骤摘要】
一种基于相位补偿的语音增强方法及系统
本专利技术涉及语音处理领域,特别是涉及一种基于相位补偿的语音增强方法及系统。
技术介绍
在许多情况下,如正常的语音通信,听力辅助和自动语音识别中,语音信号由于受到不同类型的背景噪声干扰会严重退化。因此,从退化语音中去除噪声成分一直是研究的主要目的。当前,大多数单通道语音增强方法是改变带噪语音的幅度谱实现语音增强的效果,而忽略相位谱的影响。这是因为早期的研究表明相位谱在信噪比较高的情况下感知效果不明显,因此,通过改变幅度谱实现语音增强是普遍的做法。而最近研究发现相位谱中也包含了很多与语音可懂度相关的信息,这些信息对于语音增强起到一定的作用。现有的相位谱补偿算法中补偿因子固定,无法对含噪语音的相位谱进行灵活的补偿,导致语音增强效果差。
技术实现思路
本专利技术的目的是提供一种基于相位补偿的语音增强方法及系统,以提高语音增强的效果。为实现上述目的,本专利技术提供了如下方案:一种基于相位补偿的语音增强方法,所述方法包括:获取待处理的含噪语音信号;对所述含噪语音信号进行短时傅里叶变换,进而获得所述含噪语音信号的幅度谱和相位谱;获得相位谱补偿 ...
【技术保护点】
1.一种基于相位补偿的语音增强方法,其特征在于,所述方法包括:获取待处理的含噪语音信号;对所述含噪语音信号进行短时傅里叶变换,进而获得所述含噪语音信号的幅度谱和相位谱;获得相位谱补偿函数,所述相位谱补偿函数的补偿因子λnew为
【技术特征摘要】
1.一种基于相位补偿的语音增强方法,其特征在于,所述方法包括:获取待处理的含噪语音信号;对所述含噪语音信号进行短时傅里叶变换,进而获得所述含噪语音信号的幅度谱和相位谱;获得相位谱补偿函数,所述相位谱补偿函数的补偿因子λnew为其中c为固定经验值;k为频点索引,n为帧数,|Y(n,k)|为所述含噪语音信号第n帧第k个频率点的幅度谱,|D(n,k)|为噪声第n帧第k个频率点的幅度谱;根据所述相位谱补偿函数对所述含噪语音信号的相位谱进行补偿,得到补偿后的相位谱;根据所述含噪语音信号的幅度谱获得纯净语音信号的幅值;将所述补偿后的相位谱与所述纯净语音信号的幅值重构,获得增强后的语音信号。2.根据权利要求1所述的方法,其特征在于,所述根据所述含噪语音信号的幅度谱获得纯净语音信号的幅值,具体包括:根据所述含噪语音信号的幅度谱,采用改进决策导向算法获得每一帧噪声的改进的先验信噪比;根据所述改进的先验信噪比,采用基于语音存在概率的噪声功率谱估计算法获得每一帧噪声的功率谱;根据所述每一帧噪声的功率谱,采用维纳滤波法获得纯净语音信号的幅值。3.根据权利要求2所述的方法,其特征在于,所述根据所述含噪语音信号的幅度谱,采用改进决策导向算法获得每一帧噪声的改进的先验信噪比,具体包括:根据决策导向算法估计先验信噪比其中α为时频相关平滑因子,|Y(n-1,k)|为含噪语音第n-1帧第k个频率点的幅度谱,|Y(n,k)|为含噪语音当前第n帧第k个频率点的幅度谱,是估算出的第n帧的噪声幅度值,max[·]是求最大值函数;根据所述先验信噪比确定增益函数根据所述增益函数采用改进的决策导向算法获得第n帧噪声的改进的先验信噪比其中μ为基于后验信噪比的Sigmoid型权值,其表达式为b是尺度因子;其中|D(n,k)|为噪声第n帧第k个频率点的幅度谱。4.根据权利要求2所述的方法,其特征在于,所述根据所述改进的先验信噪比,采用基于语音存在概率的噪声功率谱估计算法获得每一帧噪声的功率谱,具体包括:根据所述改进的先验信噪比,采用贝叶斯公式确定第n帧后验语音存在概率P(H1|Y)和第n帧后验语音缺失概率P(H0|Y);采用公式对第n帧噪声的功率谱进行初步估计,其中|Y(n,k)|为含噪语音当前第n帧第k个频率点幅度谱,是估算出的第n帧第k个频率点的噪声幅度值;根据公式更新第n帧噪声的功率谱,其中为估算出的第n-1帧第k个频率点噪声的幅度值,|N(n,k)|2为初步估计出的第n帧第k个频率点噪声的功率谱,为获得的更新后的第n帧第k个频率点噪声的功率谱。5.根据权利要求4所述的方法,其特征在于,所述根据所述改进的先验信噪比,采用贝叶斯公式确定第n帧后验语音存在概率P(H1|Y),之后还包括:根据公式PH1mean=(1-I)*PH1mean+I*P(H1|Y)确定后验语音存在概率P(H1|Y)的均值PH1mean,其中I为语音存在决策,判断是否满足PH1mean>0.9,如果是,更新第n帧后验语音存在概率P(H1|Y...
【专利技术属性】
技术研发人员:贾海蓉,吉慧芳,方玲,武亚红,李鸿燕,张雪英,
申请(专利权)人:太原理工大学,
类型:发明
国别省市:山西,14
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。