【技术实现步骤摘要】
一种基于噪声分类优化IMCRA算法的语音增强方法
本专利技术涉及一种语音增强方法,特别是一种基于噪声分类优化IMCRA算法的语音增强方法,属于语音处理领域。
技术介绍
在语音信号的处理过程中,噪声污染的问题不可避免。因此,如何有效地抑制噪声,提高语音信号的质量和可懂度成为众多学者研究的热点。目前,多种语音增强算法已被提出,主要包括基于信号处理的方法、基于模型训练的方法和基于统计模型的方法。在基于信号处理的方法中,谱减法和维纳滤波法是两种最具有代表性的技术。在正确估计背景噪声的情况下,该类方法能取得较好的分离性能。然而,在低信噪比的条件下,背景噪声很难准确估计,该类方法性能则大大下降。在基于模型训练的方法中,深度学习就近年来兴起的一种,该类方法在低信噪比、复杂背景噪声条件下能够表现较好的效果,但是模型训练复杂,在实际中难以实用。基于统计模型的方法,在低信噪比的条件下也可以取得比较好的分离性能,同时其相对于模型训练的方法具有较低复杂度。改进的最小控制递归平均(ImprovedMinimaControlledRecursi ...
【技术保护点】
1.一种基于噪声分类优化IMCRA算法的语音增强方法,其特征在于包含以下步骤:/n步骤一:针对不同噪声类型寻找最优的α
【技术特征摘要】
1.一种基于噪声分类优化IMCRA算法的语音增强方法,其特征在于包含以下步骤:
步骤一:针对不同噪声类型寻找最优的αs、αd和α参数组合,其中αs和αd是IMCRA算法在估计噪声功率谱时的两个平滑参数,α是先验信噪比估计的权重参数;
步骤二:利用卷积神经网络CNN对输入信号的噪声类型进行分类;
步骤三:按照不同的噪声类型,根据步骤一的寻优结果选择不同的参数组:αs、αd和α;
步骤四:根据步骤三选定的参数组,利用IMCRA方法对测试集信号进行语音增强,得到最终增强的语音。
2.按照权利要求1所述的一种基于噪声分类优化IMCRA算法的语音增强方法,其特征在于:所述步骤一具体为
1.1对输入的纯净语音进行去直流处理和幅值归一化处理;
1.2对纯净语音信号叠加不同种类的噪声,得到带噪语音信号;
1.3对于每一类噪声的带噪语音信号,进行预处理包括分帧和加窗处理;
1.4对于每一类噪声的带噪语音信号,利用固定变量法对参数α进行寻优;
1.5对于每一类噪声的带噪语音信号,利用固定变量法分别对参数αs和αd进行寻优。
3.按照权利要求2所述的一种基于噪声分类优化IMCRA算法的语音增强方法,其特征在于:所述1.4具体为
1.4.1固定参数αs和αd,选定参数α的初始值;
1.4.2将选定的参数αs、αd和α输入到IMCRA方法,并利用IMCRA方法对输入的带噪语音信号进行语音增强,得到增强的语音;
1.4.3计算增强语音的短时目标可懂度STOI、语音质量感知评估PESQ以及分段信噪比SegSNR;
1.4.4改变参数α,重复步骤1.4.2-1.4.3,直到最终得到的STOI、PESQ和SegSNR值都最大,则参数α寻优完毕。
4.按照权利要求1所述的一种基于噪声分类优化IMCRA算法的语音增强方法,其特征在于:所述步骤二具体为
2.1将带噪语音分为训练集和测试集;
2.2利用训练集信号对卷积神经网路进行训练;
2.3利用训练好的卷积神经网络对测试集信号的噪声类型进行分类。
5.按照权利要求4所述的一种基于噪声分类优化IMCRA算法的语音增强方法,其特征在于:所述2.2具体为
2.2.1对训练集信号进行预处理,包括分帧和加窗;
2.2.2对分帧加窗后的信号进行傅里叶变换:
X(i,k)=FFT[xi(n)]
其中,X(i,k)是第i帧信号在第k条谱线处的功率谱,FFT表示傅里叶变换,xi(n)表示第i帧信号,n表示序列索引号;
2.2.3利用所述的每一帧噪声信号功率谱分别计算每一帧噪声信号的梅尔频率倒谱系数MF...
【专利技术属性】
技术研发人员:张建,尹红芳,张涛,邵洋洋,
申请(专利权)人:南通赛洋电子有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。