语音增强方法、装置、设备和存储介质制造方法及图纸

技术编号：21774580 阅读：20 留言：0更新日期：2019-08-03 22:23

本发明专利技术涉及语音信号处理技术领域，提供了一种语音增强方法、装置、设备和存储介质，旨在解决现有语音增强方法计算量大、不满足实时性要求的问题。所述语音增强方法包括：获取麦克风阵列采集的当前帧带噪信号，所述当前帧带噪信号至少包括目标语音声源和其他声源各自发出的声音信号；利用所述当前帧带噪信号，确定所述当前帧带噪信号对应的时频掩模；利用所述时频掩模，确定所述当前帧带噪信号对应的滤波器系数；利用所述滤波器系数，对带噪信号进行语音增强处理。由于本发明专利技术在计算所述时频掩模时，仅需对一帧带噪信号进行处理，因此本发明专利技术的计算量较小，且满足实时性要求。

Speech enhancement methods, devices, devices and storage media

全部详细技术资料下载

【技术实现步骤摘要】
语音增强方法、装置、设备和存储介质
本专利技术涉及语音信号处理
，具体而言，涉及一种语音增强方法、装置、设备和存储介质。
技术介绍
噪声环境下，许多语音处理系统的性能急剧下降。语音增强作为解决噪声污染的一种有效的预处理技术，一直是语音信号处理领域的热点。语音增强的目的是从带噪信号中提取出尽可能纯净的原始语音信号，提高信噪比，改善语音质量。现有技术中，语音增强的一般原理为：首先利用滤波器系数对经过傅里叶变换或短时傅里叶变换的带噪信号进行滤波，得到增强的频域信号；然后再对所述增强的频域信号做反傅里叶变换，得到增强的时域信号，从而输出。其中对于滤波器系数的确定，现有技术中存在多种确定方法。常规的确定方法中，滤波器系数被确定为一个固定值，由于噪声本身一般会跟随时间而变化，因此将滤波器系数被确定为一个固定值不符合一般的自然规律，利用此滤波器系数进行语音增强的方法仅能适用于噪声场恒定情况下语音增强，适应性弱。为了克服上述问题，现有的另一种算法是采用EM算法，利用缓存的一段较长的带噪信号数据，首先计算出该段语音对应的时频掩模，然后利用所述时频掩模计算该段语音对应的滤波器系...

【技术保护点】
1.一种语音增强方法，其特征在于，包括：获取麦克风阵列采集的当前帧带噪信号，所述当前帧带噪信号至少包括目标语音声源和其他声源各自发出的声音信号；利用所述当前帧带噪信号，确定所述当前帧带噪信号对应的时频掩模；利用所述时频掩模，确定所述当前帧带噪信号对应的滤波器系数；利用所述滤波器系数，对带噪信号进行语音增强处理。

【技术特征摘要】
1.一种语音增强方法，其特征在于，包括：获取麦克风阵列采集的当前帧带噪信号，所述当前帧带噪信号至少包括目标语音声源和其他声源各自发出的声音信号；利用所述当前帧带噪信号，确定所述当前帧带噪信号对应的时频掩模；利用所述时频掩模，确定所述当前帧带噪信号对应的滤波器系数；利用所述滤波器系数，对带噪信号进行语音增强处理。2.根据权利要求1所述的语音增强方法，其特征在于，利用所述当前帧带噪信号，确定所述当前帧带噪信号对应的时频掩模，包括：根据所述当前帧带噪信号，确定所述目标语音声源相对于所述麦克风阵列的估计方位；根据所述估计方位与目标区域之间的相对位置关系，确定所述当前帧带噪信号对应的时频掩模，其中所述目标区域为所述目标语音声源所在的实际位置区域。3.根据权利要求2所述的语音增强方法，其特征在于，根据所述估计方位与目标区域之间的相对位置关系，确定所述当前帧带噪信号对应的时频掩模，包括：如果所述估计方位位于所述目标区域内，则确定所述时频掩模为预设固定值T1；如果所述估计方位位于所述目标区域外，则确定所述时频掩模为预设固定值T2；其中0≤T1＜T2≤1。4.根据权利要求2所述的语音增强方法，其特征在于，根据所述估计方位与目标区域之间的相对位置关系，确定所述当前帧带噪信号对应的时频掩模，包括：如果所述估计方位位于所述目标区域外，则确定所述时频掩模为预设固定值T3，其中0＜T3≤1；如果所述估计方位位于所述目标区域内，则根据所述估计方位在所述目标区域内的具体相对位置，确定所述时频掩模为T4；其中0≤T4＜T3。5.根据权利要求4所述的语音增强方法，其特征在于，所述T4的数值的大小满足以下关系：所述估计方位越靠近所述目标区域的中心位置，所述T4的数值越接近0；所述估计方位越靠近所述目标区域的边缘位置，所述T4的数值越接近所述T3。6.根据权利要求1所述...

【专利技术属性】
技术研发人员：汪法兵，李健，张连毅，武卫东，
申请(专利权)人：北京捷通华声科技股份有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人