一种基于改进卷积循环网络的单通道语音增强方法技术

技术编号:43841034 阅读:42 留言:0更新日期:2024-12-31 18:36
本发明专利技术提供了一种基于改进卷积循环网络的单通道语音增强方法,包括:步骤1:下载模型训练和测试所用的数据集,通过采用VoiceBank+DEMAND数据集对数据集的语音进行预处理,并通过短时傅里叶变换(STFT)提取语音信号的幅度谱;步骤2:将幅度谱输入到编码器中,从幅度谱中提取高维特征;步骤3:使用Channel‑S4D block作为模型的递归模块,Channel‑S4D block输出的结果会输入到解码器中,被恢复到原始的维度;步骤4:构造联合损失函数;步骤5:重建和评估增强语音信号。本发明专利技术基于对角化状态空间模型构造的Channel‑S4D模块高效地处理语音序列,捕捉通道级别的语音关键信息,更好地建模语音信号的时间依赖关系,在降低模型的参数量和计算量的同时,提高了模型对复杂噪声环境的适应性。

【技术实现步骤摘要】

本专利技术涉及一种基于改进卷积循环网络的单通道语音增强方法,具体涉及一种新型的、高效的、轻量级的卷积递归网络(crnv2)用于单通道语音增强,属于语音增强。


技术介绍

1、在现代社会中,清晰的语音是有效沟通的基础。然而,背景噪声和混响等不利因素经常损害语音信号的可理解性和质量,影响我们日常的语音通信质量。因此,研究解决噪声干扰的语音增强(se)技术至关重要。语音增强技术旨在提高语音信号的质量和清晰度,使其更易于理解和识别。近年来,随着深度学习技术的发展,基于深度学习的语音增强方法逐渐成为研究的热点。深度学习通过大规模数据的训练,能够自动学习语音信号中的特征和模式,从而使模型能够更准确地分析和重建受损的语音信号。深度学习的一些常见模型如卷积神经网络(convolutional neural network,cnn)、递归神经网络(recurrent neuralnetwork,rnn)在语音增强领域展现了显著的效果。其中,卷积递归网络(convolutionalrecurrent network,crn),它整合了cnn和rnn的优势,已被证明在语音增强方面本文档来自技高网...

【技术保护点】

1.一种基于改进卷积循环网络的单通道语音增强方法,其特征在于,所述该方法包括如下步骤:

2.根据权利要求1所述的一种基于改进卷积循环网络的单通道语音增强方法,其特征在于,所述步骤1具体包括:

3.根据权利要求1所述的一种基于改进卷积循环网络的单通道语音增强方法,其特征在于,所述步骤2具体包括:

4.根据权利要求1所述的一种基于改进卷积循环网络的单通道语音增强方法,其特征在于,所述步骤3具体包括:

5.根据权利要求4所述的一种基于改进卷积循环网络的单通道语音增强方法,其特征在于,所述步骤3-1具体包括:

6.根据权利要求1所述的一...

【技术特征摘要】

1.一种基于改进卷积循环网络的单通道语音增强方法,其特征在于,所述该方法包括如下步骤:

2.根据权利要求1所述的一种基于改进卷积循环网络的单通道语音增强方法,其特征在于,所述步骤1具体包括:

3.根据权利要求1所述的一种基于改进卷积循环网络的单通道语音增强方法,其特征在于,所述步骤2具体包括:

4.根据权利要求1所述的一种基于改进卷积循环网络的单通道语音增...

【专利技术属性】
技术研发人员:孙林慧朱郑董志荣李平安叶蕾
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1