改进基于掩码的语音增强中的噪声补偿制造技术

技术编号：41748778 阅读：28 留言：0更新日期：2024-06-21 21:34

描述了用于改进基于掩码的语音增强中的噪声补偿的方法和装置。一种处理包括一个或多个语音片段的音频信号的方法，该方法包括获得用于对该音频信号进行基于掩码的语音增强的掩码，以及获得该音频信号的幅度。基于掩码和音频信号的幅度，在基于掩码的语音增强之后确定音频信号中的残留噪声的估计值。基于残留噪声的估计值来确定经修改的掩码。进一步描述了对应的程序和计算机可读存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本公开涉及语音增强技术，并且更具体地涉及改进基于掩码的语音增强方法和设备。

技术介绍

1、大多数语音增强算法的性能都在很大程度上取决于输入音频信号的snr。因此，在snr较低的输入信号中进行语音增强是一个具有挑战性的问题。许多语音增强算法都依赖于基于掩码的方法，比如二元掩码。通过将掩码应用于输入音频信号，可以生成去噪音频信号。

2、然而，对于音频信号中的低snr部分，由于在这种情况下去除噪声存在挑战，在去噪音频信号输出中通常可观察到泵动/门控问题。

3、特别地，大多数基于掩码的算法都会试图去除非对话片段内的所有噪声，但对话片段内的噪声却无法被完全滤除。这种行为在去噪音频输出信号中的对话片段与非对话片段之间产生不一致。这些不一致可能会被听作噪声泵动/门控，并且可能会使去噪输出音频信号的收听者感到厌烦。

4、因此，需要改进基于掩码的语音增强技术，特别是减少或去除去噪音频输出信号中对话片段与非对话片段之间的不一致。

技术实现思路

1、鉴于以上所述，本公开提供了...

【技术保护点】

1.一种处理包括一个或多个语音片段的音频信号的方法，所述方法包括：

2.如权利要求1所述的方法，进一步包括：

3.如权利要求1或2所述的方法，其中，所述掩码的值介于0到1之间，或者所述掩码的值被压缩为介于0和1之间的值。

4.如权利要求1至3中任一项所述的方法，其中，所述音频信号包括所述语音片段和非语音片段。

5.如权利要求1至4中任一项所述的方法，其中，所述残留噪声的估计值基于所述掩码与所述掩码的函数之间的差异来确定。

6.如权利要求5所述的方法，其中，所述掩码的函数是凸函数。

7.如权利要求5或6所述的方法，其中...

【技术特征摘要】
【国外来华专利技术】

1.一种处理包括一个或多个语音片段的音频信号的方法，所述方法包括：

2.如权利要求1所述的方法，进一步包括：

3.如权利要求1或2所述的方法，其中，所述掩码的值介于0到1之间，或者所述掩码的值被压缩为介于0和1之间的值。

4.如权利要求1至3中任一项所述的方法，其中，所述音频信号包括所述语音片段和非语音片段。

5.如权利要求1至4中任一项所述的方法，其中，所述残留噪声的估计值基于所述掩码与所述掩码的函数之间的差异来确定。

6.如权利要求5所述的方法，其中，所述掩码的函数是凸函数。

7.如权利要求5或6所述的方法，其中，所述掩码的函数由f(x)给定，其中，对于限制在0到1范围内的掩码值，f(0)＝0并且f(1)＝1。

8.如权利要求5至7中任一项所述的方法，其中，所述掩码的函数是指数大于1的幂函数。

9.如权利要求1至8中任一项所述的方法，其中，为多个时间-频率仓或时间仓和频带中的每一个定义所述掩码。

10.如权利要求1至9中任一项所述的方法，其中，确定经修改的掩码，使得经修改的掩码是稳定的掩码，或者使得当经修改的掩码被应用于所述音频信号时残留噪声是稳定的。

11.如权利要求1至10中任一项所述的方法，进一步包括：

12.如权利要求11所述的方法，其中，基于话音活动检测器vad来确定所述音频信号中的一个或多个语音片段。

13.如权利要求1至12中任一项所述的方法，其中，确定经修改的掩码包括：

14.如权利要求13所述的方法，其中，所述选择基于所述掩码与所述平均残留掩码的比较，并且所述平均残留掩码通过对一段时间内的残留掩码进行平均来确定，所述残留掩码与所述残留噪声的估计值相关。

15.如权利要求13或14所述的方法，其中，仅针对所述一个或多个语音片段来确定所述平均残留掩码。

16.如权利要求13至15中任一项所述的方法，其中，针对每个时间-频率仓或时间仓和频带，选择所述掩码和平均残留掩码之一包括：

17.如权利要求14至16中任一项所述的方法，其中，所述残留掩码基于所...

【专利技术属性】
技术研发人员：孙俊岱，双志伟，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人