一种单通道语音同时降噪和去混响系统技术方案

技术编号:26532839 阅读:39 留言:0更新日期:2020-12-01 14:17
本发明专利技术公开了一种单通道语音同时降噪和去混响系统,包括:语音降噪模块、语音去混响模块和联合训练模块,语音降噪模块利用深度聚类算法训练深度嵌入式特征提取器,从混合的语音信号中提取深度嵌入式特征,将输入的混合语音映射到一个没有噪声的嵌入式空间中,因此深度嵌入式特征不包含噪声,且对混响和直达声区分性很大;语音去混响模块与语音降噪模块连接,将混响语音信号从深度嵌入式特征中去除,估计出干净目标的直达声,从而实现语音降噪和去混响的目的;联合训练模块分别与语音降噪模块和语音去混响模块连接,用于联合优化语音降噪和语音去混响模块,提升增强后语音的质量和可懂度。

【技术实现步骤摘要】
一种单通道语音同时降噪和去混响系统
本专利技术涉及信号处理
,尤其是涉及了一种单通道语音同时降噪和去混响系统。
技术介绍
语音作为人类交流信息的主要手段之一,语音降噪和去混响一直在语音信号处理中占据着重要的地位。在真实环境中,语音信号往往会同时包含混响和噪声,会严重影响语音的质量和可懂度,同时对语音识别和声纹识别系统的性能影响也比较大。因此,语音去混响和降噪就显得很重要。为了解决语音去混响问题,在过去的多年很多方法也被提出来。加权预测误差(WPE)算法在信号层面处理语音去混响,即延时线性预测。WPE首先通过多个历史帧得到与频率相关的线性预测滤波器。然后在子带域从原始混响信号中减去滤波后的信号,得到增强信号。但是,当噪声和混响同时存在时,WPE算法的性能会受到严重的影响,制约着该方法的应用。近年来,随着计算机技术的发展,基于深度学习的语音去混响方法得到了很大的发展,受到了越来越多人的关注。基于深度学习的语音去混响方法通过训练语音去混响模型,建立混合语音特征参数与目标干净语音信号的特征参数之间的映射关系,这样对于任意输入的混合语音信号本文档来自技高网...

【技术保护点】
1.一种单通道语音同时降噪和去混响系统,其特征在于包括:语音降噪模块、语音去混响模块和联合训练模块,语音降噪模块利用深度聚类算法训练深度嵌入式特征提取器,从混合的语音信号中提取深度嵌入式特征,将输入的混合语音映射到一个没有噪声的嵌入式空间中,语音去混响模块与语音降噪模块连接,将混响语音信号从深度嵌入式特征中去除,估计出干净目标的直达声,联合训练模块分别与语音降噪模块和语音去混响模块连接,用于联合优化语音降噪和语音去混响模块。/n

【技术特征摘要】
1.一种单通道语音同时降噪和去混响系统,其特征在于包括:语音降噪模块、语音去混响模块和联合训练模块,语音降噪模块利用深度聚类算法训练深度嵌入式特征提取器,从混合的语音信号中提取深度嵌入式特征,将输入的混合语音映射到一个没有噪声的嵌入式空间中,语音去混响模块与语音降噪模块连接,将混响语音信号从深度嵌入式特征中去除,估计出干净目标的直达声,联合训练模块分别与语音降噪模块和语音去混响模块连接,用于联合优化语音降噪和语音去混响模块。


2.如权利要求1所述的一种单通道语音同时降噪和去混响系统,其特征在于所述语音降噪模块对输入的混合语音信号进行短时傅里叶变换,将时域信号变换到频域信号后,对其进行建模,利用深度聚类算法提取深度嵌入式特征,将输入的混合语音映射到一个没有噪声的嵌入式空间中,深度嵌入式特征利用深度神经网络训练得到,语音降噪模块的训练损失目标函数为:



V是深度嵌入式特征,表示实数,TF是经过傅里叶变换后的时频块,B是每一个时频块直达声和混响的对应关系,表示平方Frobenius范数。


3.如...

【专利技术属性】
技术研发人员:范存航温正棋
申请(专利权)人:中科极限元杭州智能科技股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1