一种语音增强方法、装置、电子设备和存储介质制造方法及图纸

技术编号：32013190 阅读：31 留言：0更新日期：2022-01-22 18:30

本实施例公开了一种语音增强方法、装置、电子设备和存储介质。该方法包括：获取待增强语音信号的功率谱和相位谱，以及待增强语音信号中噪声信号的功率谱估计值，其中，待增强语音信号包括纯净语音信号和噪声信号；根据待增强语音信号的功率谱和噪声信号的功率谱估计值确定纯净语音信号的功率谱估计值；根据纯净语音信号的功率谱估计值确定不同频带下的掩蔽阈值；根据掩蔽阈值和待增强语音信号的功率谱确定纯净语音信号的增强功率谱估计值；根据待增强语音信号的相位谱以及纯净语音信号的增强功率谱估计值，确定增强语音信号。本发明专利技术实施例通过确定掩蔽阈值得到增强语音信号，可以增强噪声抑制结果，提高语音的识别效果。提高语音的识别效果。提高语音的识别效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音增强方法、装置、电子设备和存储介质

[0001]本申请实施例涉及信号处理
，尤其涉及一种语音增强方法、装置、电子设备和存储介质。

技术介绍

[0002]随着信号处理技术和语音识别技术的迅速发展，前端预处理中的语音增强技术也变得越来越重要。一般情况下，当设备播放声音时，噪声都会伴随着语音一起被听到，然而噪声的存在会对语音产生干扰，甚至会影响人耳对语音的感知。通常情况下，会采用语音增强的方法对含有噪声的语音信号进行处理。
[0003]目前，语音增强方法主要有谱减法、小波变换法、维纳滤波法等。其中，谱减法在输入信号的信噪比较高时能较好的抑制噪声，但在信噪比较低时，噪声残留较多，且对于谱减后得到的负值进行半波整流处理，会导致“音乐噪声”的出现，严重影响语音的的识别效果。也就是说，在非平稳环境下，许多语音增强方法会出现跟踪延迟、误差较大的问题。
[0004]因此，如何在非平稳环境下抑制噪声且增强语音效果，是本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]本专利技术实施例提供一...

【技术保护点】

【技术特征摘要】
1.一种语音增强方法，其特征在于，包括：获取待增强语音信号的功率谱和相位谱，以及所述待增强语音信号中噪声信号的功率谱估计值，其中，所述待增强语音信号包括纯净语音信号和噪声信号；根据所述待增强语音信号的功率谱和所述噪声信号的功率谱估计值确定纯净语音信号的功率谱估计值；根据所述纯净语音信号的功率谱估计值确定不同频带下的掩蔽阈值；根据所述掩蔽阈值和所述待增强语音信号的功率谱确定纯净语音信号的增强功率谱估计值；根据所述待增强语音信号的相位谱以及纯净语音信号的增强功率谱估计值，确定增强语音信号。2.根据权利要求1所述的方法，其特征在于，根据所述纯净语音信号的功率谱估计值确定不同频带下的掩蔽阈值，包括：获取纯净语音信号的功率谱估计值在迭代计算中相邻两次迭代的取值；根据所述纯净语音信号的功率谱估计值的相邻两次迭代的取值，确定频带的参数值；根据所述频带的参数值与噪声信号的功率谱估计值，确定掩蔽阈值。3.根据权利要求2所述的方法，其特征在于，根据所述纯净语音信号的功率谱估计值的相邻两次迭代的取值，确定频带的参数值，包括：采用如下公式确定频带的参数值：其中，j是迭代次数，i是频带数，是第j次迭代中第i个频带的纯净语音信号的功率谱估计值，是第(j
‑
1)次迭代中第i个频带的纯净语音信号的功率谱估计值，α
j
(i)是第j次迭代中第i个频带的参数值。4.根据权利要求3所述的方法，其特征在于，根据所述频带的参数值与噪声信号的功率谱估计值，确定掩蔽阈值，包括：采用如下公式确定掩蔽阈值：其中，N
j
(i)是第j次迭代中第i个频带的噪声信号的功率谱估计值，N
(j
‑
1)
(i)是第(j
‑
1)次迭代中第i个频带的噪声信号的功率谱估计值，T
j
(i)是第j次迭代中第i个频带的掩蔽阈值。5.根据权利要求1所述的方法，其特征在于，根据所述掩蔽阈值和所述待增强语音信号的功...

【专利技术属性】
技术研发人员：秦永红，付贤会，刘武钊，
申请(专利权)人：北京融讯科创技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人