一种利用数理统计和深度网络结合的语音降噪通用方法技术

技术编号:30830946 阅读:40 留言:0更新日期:2021-11-18 12:44
本发明专利技术公开了一种利用数理统计和深度网络结合的语音降噪通用方法,包括以下步骤:a.带噪语音输入,用短时傅立叶变换,得到带噪频谱的64个子带;b.计算64个子带的三角滤波对数能量;c.计算子带能量的倒谱系数作为特征,输入LSTM神经网络模型;d.用LSTM神经网络模型计算语音权重。本发明专利技术中,使用小尺寸的神经网络模型,充分利用它的非线性优势,把难处理的降噪成分的占比交给深度学习,并用拉式滤波估计残留稳态噪声及小波瞬时特性估计音乐噪声伪影得到干净频谱,具有低成本、低延时、低功耗,可以很好解决各类噪声,有较好保真度、自然度和可懂度的特性。和可懂度的特性。和可懂度的特性。

【技术实现步骤摘要】
一种利用数理统计和深度网络结合的语音降噪通用方法


[0001]本专利技术涉及语音降噪
,尤其涉及一种利用数理统计和深度网络结合的语音降噪通用方法。

技术介绍

[0002]基于传统的语音降噪算法有很多(可参考图1),大类归为噪声抑制和语音增强。
[0003]对于单支麦克风的单通道情况,噪声抑制常见的有维纳滤波、卡尔曼滤波、自适应滤波器等基于数理统计原理的减谱法,此类方法听感还不错,但是在强噪声下或者全频污染,要保留较好的降噪效果,会引起很大的语音畸变,保真度无法得到保证。另一个最大的缺陷是无法很好的处理非稳态突发噪声,如狗叫、键盘敲击等突发噪声。由于短时傅立叶变换无法同时兼顾时域和频域的分辨率,选择较大的收敛因子会导致降噪完不平稳;选择较小的收敛因子则收敛时间长,无法及时处理突发噪声。
[0004]因此也有基于小波包变换,此方法计算复杂度高,而且目前针对语音的小波基还在研究中,还没有较通用的小波基可用于语音降噪的工程产品,目前大部分小波基算法用于机械故障检测和图像边缘检测等领域。
[0005]对于多支麦克风的多通道语本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种利用数理统计和深度网络结合的语音降噪通用方法,其特征在于,包括以下步骤:a.带噪语音输入,用短时傅立叶变换,得到带噪频谱的64个子带;b.计算64个子带的三角滤波对数能量;c.计算子带能量的倒谱系数作为特征,输入LSTM神经网络模型;d.用LSTM神经网络模型计算语音权重;e.通过语音权重系数作用于带噪频谱,得到初级干净频谱;f.通过拉式滤波和小波作用于初级干净频谱,得到干净频谱;g.输入干净频谱,用短时傅立叶逆变换回干净语音。2.根据权利要求1所述的一种利用数理统计和深度网络结合的语音降噪通用方法,其特征在于,所述d步骤中的LSTM神经网络模型构建步骤为:S1.带...

【专利技术属性】
技术研发人员:郑珊珊赵亚丽缪炜
申请(专利权)人:上海互问信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1