一种基于卷积递归神经网络的单通道实时降噪方法技术

技术编号：21275454 阅读：30 留言：0更新日期：2019-06-06 09:04

本公开揭示了一种基于卷积递归神经网络的单通道实时降噪方法、装置及电子设备、存储介质，属于计算机技术领域。所述方法包括：从接收的单通道声音信号中提取声学特征，将所述声学特征在预先训练的卷积递归神经网络模型中进行迭代运算，计算所述声学特征的比值膜，采用所述比值膜对所述声学特征进行掩蔽，将经过掩蔽后的所述声学特征与所述单通道声音信号的相位进行合成，得到语音信号。上述基于卷积递归神经网络的单通道实时降噪方法及装置能够减少神经网络参数数量，降低数据存储量和对系统数据带宽的需求，在能够实现良好的降噪性能的同时大大提高了单通道语音降噪的实时性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积递归神经网络的单通道实时降噪方法
本公开涉及计算机应用
，特别涉及一种基于卷积递归神经网络的单通道实时降噪方法、装置及电子设备、存储介质。
技术介绍
语音降噪指将目标语音信号与背景噪声进行分离从而消除或抑制背景噪声。单通道语音是仅依靠单麦克风录音生成的语音信号，与基于波束形成的降噪技术(即通过麦克风阵列的适当配置进行空间滤波)相比，单通道语音降噪可以应用于更宽泛的声学场景。单通道语音降噪不仅在成本上有优势，而且在实际情况下也更容易使用。此外，单通道语音分离可用于强化波束形成和相关的麦克风阵列的效果。由于单通道语音没有麦克风阵列提供的空间信息作为参考，因此单声道语音降噪尤为困难。最近，将单通道语音降噪当作一种监督学习，突破性地将信号处理问题转变为监督学习任务。以传统的语音增强为代表的信号处理方法是基于背景噪声和语音的一般统计分析，而监督学习方法由数据驱动，并且能够自动地从具体的训练样本中学习。可以说，监督学习方法的引入实现了单通道语音降噪技术的飞跃。然而，目前监督学习的单通道语音降噪方法中，网络参数的数量较多且模型较为复杂，影响了单通道语音降噪的实时性及降噪效果。
技术实现思路
为了解决相关技术中单通道语音降噪的网络参数数量较多且模型较为复杂的技术问题，本公开提供了一种基于卷积递归神经网络的单通道实时降噪方法、装置及终端。第一方面，提供了一种基于卷积递归神经网络的单通道实时降噪方法，包括：从接收的单通道声音信号中提取声学特征；将所述声学特征在预先训练的卷积递归神经网络模型中进行迭代运算，计算所述声学特征的比值膜；采用所述比值膜对所述声学特征进行...

【技术保护点】
1.一种基于卷积递归神经网络的单通道实时降噪方法，其特征在于，所述方法包括：从接收的单通道声音信号中提取声学特征；将所述声学特征在预先训练的卷积递归神经网络模型中进行迭代运算，计算所述声学特征的比值膜；采用所述比值膜对所述声学特征进行掩蔽；将经过掩蔽后的所述声学特征与所述单通道声音信号的相位进行合成，得到语音信号。

【技术特征摘要】
1.一种基于卷积递归神经网络的单通道实时降噪方法，其特征在于，所述方法包括：从接收的单通道声音信号中提取声学特征；将所述声学特征在预先训练的卷积递归神经网络模型中进行迭代运算，计算所述声学特征的比值膜；采用所述比值膜对所述声学特征进行掩蔽；将经过掩蔽后的所述声学特征与所述单通道声音信号的相位进行合成，得到语音信号。2.根据权利要求1所述的方法，其特征在于，所述从接收的单通道声音信号中提取声学特征的步骤包括：将接收的单通道声音信号按照预设时间周期分为时间帧；从所述时间帧中提取频谱幅度矢量；对所述频谱幅度矢量进行归一化处理，形成声学特征。3.根据权利要求2所述的方法，其特征在于，所述频谱幅度矢量进行归一化处理，形成声学特征的步骤包括：将当前时间帧与过去时间帧的频谱幅度矢量合并进行归一化处理形成声学特征。4.根据权利要求2所述的方法，其特征在于，所述频谱幅度矢量进行归一化处理，形成声学特征的步骤包括：将当前时间帧、过去时间帧与未来时间帧的频谱幅度矢量合并进行归一化处理，形成声学特征。5.根据权利要求1所述的方法，其特征在于，所述声学特征在预先训练的卷积递归神经网络模型中进行迭代运算，计算所述声学特征的比值膜的步骤包括：将卷积神经网络与具有长短期记忆的递归神经网络进行组合得到卷积递归神经网络；通过所述卷积递归神经网络对预先收集的语音训练集进行训练，构建所述卷积递归神经网络模型。6.根据权利要求5所述的方法，其特征在于，所述卷积神经网络为卷积编码器-解码器结构，所述编码器包括一组卷积层和池化层，所述解码器的结构与反向顺序的所述编码器相同，所述编码器的输出连接所述解码器的输入。7.根据权利...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：大象声科深圳科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人