【技术实现步骤摘要】
一种基于双层字典学习的单通道语音增强方法
本专利技术属于语音信号处理
,具体涉及一种基于双层字典学习的单通道语音增强方法。
技术介绍
在实际环境中语音信号往往会受到各种噪声的干扰,语音增强的目的是尽可能从带噪语音信号中有效去除噪声且能不失真地估计语音信号,最传统的语音增强算法是谱减法、基于统计模型的方法、子空间方法。但在现实生活中,噪声通常是非平稳的,可能与纯语音相似,暴露了传统方法的缺点。近年来,基于稀疏模型的语音增强算法被证明可以有效减少非平稳噪声的干扰,并且在语音增强和源分离方面效果良好。因此,基于稀疏模型的各种语音信号处理算法不断引起相关学者的密切关注。Sigg提出基于联合字典学习的语音增强算法,在由纯净语音字典和噪声字典组成的联合字典上,通过对带噪语音信号进行稀疏编码,以估量出纯净语音。上述在联合字典上稀疏地表示带噪混合信号时,带噪混合信号中的语音成分仍然有部分会投影在干扰噪声子字典上。同理,带噪混合信号中的噪声成分也有部分会投影在干扰语音字典上,也就是“交叉投影”会带来更多的源混淆。某种程度上,在语 ...
【技术保护点】
1.一种基于双层字典学习的单通道语音增强方法,其特征在于,包括如下步骤,/n步骤S1、对输入的语音和噪声样本进行采集、预处理及混合后,将其训练为稀疏子字典,稀疏子字典再通过约束目标优化函数获取单层联合字典和双层联合字典;/n步骤S2、对带噪语音进行增强处理,并将带噪语音在双层联合字典的第一层联合字典上投影,通过比较增强后的带噪语音的能量与预设的阈值,判断是否在第二层联合字典上投影。/n
【技术特征摘要】
1.一种基于双层字典学习的单通道语音增强方法,其特征在于,包括如下步骤,
步骤S1、对输入的语音和噪声样本进行采集、预处理及混合后,将其训练为稀疏子字典,稀疏子字典再通过约束目标优化函数获取单层联合字典和双层联合字典;
步骤S2、对带噪语音进行增强处理,并将带噪语音在双层联合字典的第一层联合字典上投影,通过比较增强后的带噪语音的能量与预设的阈值,判断是否在第二层联合字典上投影。
2.根据权利要求1所述的一种基于双层字典学习的单通道语音增强方法,其特征在于,所述步骤S1包括如下步骤,
步骤S11、对每一句输入的时域连续纯净语音和噪声样本进行采样,再按照预设的信噪比的值调整噪声信号的幅值,获取M帧语音信号和噪声信号及用于训练的带噪语音信号;
步骤S12、对语音信号和噪声信号分别进行K-SVD字典训练,并采用BP算法重构信号,获取语音子字典和噪声子字典;
步骤S13、将语音子字典和噪声子字典拼接成初始的单层联合字典和双层联合字典,再通过约束目标优化函数获取最优的单层联合字典和双层联合字典。
3.根据权利要求2所述的一种基于双层字典学习的单通道语音增强方法,其特征在于,获取最优的单层联合字典和双层联合字典的具体步骤为,
步骤S131、将语音子字典和噪声子字典拼接为联合字典D;
步骤S132、通过BP算法将训练的带噪语音信号在初始的联合字典D上投影,获取稀疏编码系数;
步骤S133、计算出L-BFGS算法中所需要的目标优化函数的梯度;
步骤S134、通过L-BFGS算法迭代求解优化函数,获取最优联合字典。
4.根据权利要求3所述的一种基于双层字典学习的单通道语音增强方法,其特征在于,所述步骤S131中,单层联合字典的学习中,将第一层的语音子字典Ds和噪声子字典Dn拼接为单层联合字典D=[Ds,Dn];双层联合字典的学习中,固定第一层所学习的语音子字典Ds和噪声子字典Dn,优化第二层所学习的语音子字典Es和噪声子字典En,最后拼接各子字典得获取双层联合字典D=[Ds,Es,Dn,En]。
5.根据权利要求3所述的一种基于双层字...
【专利技术属性】
技术研发人员:孙林慧,吴子皓,谢可丽,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。