【技术实现步骤摘要】
一种利用数理统计和深度网络结合的语音降噪通用方法
[0001]本专利技术涉及语音降噪
,尤其涉及一种利用数理统计和深度网络结合的语音降噪通用方法。
技术介绍
[0002]基于传统的语音降噪算法有很多(可参考图1),大类归为噪声抑制和语音增强。
[0003]对于单支麦克风的单通道情况,噪声抑制常见的有维纳滤波、卡尔曼滤波、自适应滤波器等基于数理统计原理的减谱法,此类方法听感还不错,但是在强噪声下或者全频污染,要保留较好的降噪效果,会引起很大的语音畸变,保真度无法得到保证。另一个最大的缺陷是无法很好的处理非稳态突发噪声,如狗叫、键盘敲击等突发噪声。由于短时傅立叶变换无法同时兼顾时域和频域的分辨率,选择较大的收敛因子会导致降噪完不平稳;选择较小的收敛因子则收敛时间长,无法及时处理突发噪声。
[0004]因此也有基于小波包变换,此方法计算复杂度高,而且目前针对语音的小波基还在研究中,还没有较通用的小波基可用于语音降噪的工程产品,目前大部分小波基算法用于机械故障检测和图像边缘检测等领域。
[0005]对于 ...
【技术保护点】
【技术特征摘要】
1.一种利用数理统计和深度网络结合的语音降噪通用方法,其特征在于,包括以下步骤:a.带噪语音输入,用短时傅立叶变换,得到带噪频谱的64个子带;b.计算64个子带的三角滤波对数能量;c.计算子带能量的倒谱系数作为特征,输入LSTM神经网络模型;d.用LSTM神经网络模型计算语音权重;e.通过语音权重系数作用于带噪频谱,得到初级干净频谱;f.通过拉式滤波和小波作用于初级干净频谱,得到干净频谱;g.输入干净频谱,用短时傅立叶逆变换回干净语音。2.根据权利要求1所述的一种利用数理统计和深度网络结合的语音降噪通用方法,其特征在于,所述d步骤中的LSTM神经网络模型构建步骤为:S1.带...
【专利技术属性】
技术研发人员:郑珊珊,赵亚丽,缪炜,
申请(专利权)人:上海互问信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。