对语音增强中的语音保留的控制制造技术

技术编号：41748737 阅读：21 留言：0更新日期：2024-06-21 21:34

提供了一种用于对音频信号执行去噪的方法。在一些实施方式中，方法涉及确定调节要应用的语音保留的程度的激进性控制参数值。在一些实施方式中，方法涉及获得训练样本的训练集，训练样本具有有噪声音频信号和目标去噪掩码。在一些实施方式中，方法涉及训练机器学习模型，其中，经训练的机器学习模型可用于将有噪声测试音频信号作为输入，并生成对应的去噪测试音频信号，并且其中，激进性控制参数值被用于以下各项：1)生成包括在训练集中的有噪声音频信号的频域表示；2)修改目标去噪掩码；3)确定机器学习模型的架构；或4)确定机器学习模型的训练期间的损失。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本公开涉及用于控制语音增强中的语音保留的系统、方法和介质。

技术介绍

1、例如，去噪技术可以应用于有噪声音频信号，以生成去噪的或纯净的音频信号。然而，执行去噪技术可能很困难，特别是对于各种类型的音频内容，比如包括音乐、多个说话者之间的对话或交谈、音乐和语音的混合等的音频内容。

2、符号和术语

3、在整个本公开中，包括在权利要求书中，术语“扬声器(speaker)”、“扩音器(loudspeaker)”和“音频再现换能器”同义地用于表示任何发声换能器(或一组换能器)。一套典型的耳机包括两个扬声器。扬声器可以被实施为包括多个换能器(例如，低音扬声器和高音扬声器)，所述换能器可以由单个公共扬声器馈送或多个扬声器馈送驱动。在一些示例中，(多个)扬声器馈送可以在耦接到不同换能器的不同电路分支中经历不同处理。

4、在整个本公开中，包括在权利要求中，在广义上使用“对”信号或数据执行操作的表达(例如，对信号或数据进行滤波、缩放、变换或应用增益)来表示直接对信号或数据执行操作或对信号或数据的已处理版本(例如，在对其执行...

【技术保护点】

1.一种对音频信号执行去噪的方法，包括：

2.如权利要求1所述的方法，其中，生成所述有噪声音频信号的频域表示包括：

3.如权利要求1或2中任一项所述的方法，其中，修改在所述训练集中包括的所述目标去噪掩码包括对所述目标去噪掩码中的目标去噪掩码应用幂函数，并且其中，所述幂函数的指数是基于所述激进性控制参数值来确定的。

4.如权利要求1至3中任一项所述的方法，其中，所述机器学习模型包括卷积神经网络(CNN)，并且其中，确定所述机器学习模型的架构包括基于所述激进性控制参数值来确定所述CNN的卷积块的滤波器大小。

5.如权利要求1至3中任一项所述的方...

【技术特征摘要】
【国外来华专利技术】

1.一种对音频信号执行去噪的方法，包括：

2.如权利要求1所述的方法，其中，生成所述有噪声音频信号的频域表示包括：

4.如权利要求1至3中任一项所述的方法，其中，所述机器学习模型包括卷积神经网络(cnn)，并且其中，确定所述机器学习模型的架构包括基于所述激进性控制参数值来确定所述cnn的卷积块的滤波器大小。

5.如权利要求1至3中任一项所述的方法，其中，所述机器学习模型包括u-net，并且其中，确定所述机器学习模型的架构包括基于所述激进性控制参数值来确定所述u-net的深度。

6.如权利要求1至5中任一项所述的方法，其中，确定所述损失包括对所述预测去噪掩码相对于所述目标去噪掩码的误差应用惩罚权重，并且其中，所述惩罚权重是至少部分地基于所述激进性控制参数值来确定的。

7.如权利要求6所述的方法，其中，所述惩罚权重至少部分地基于与所述训练样本相关联的对应有噪声音频信号是否包括语音。

8.一种对音频信号执行去噪的方法，所述方法包括：

9.如权利要求8所述的方法，其中，修改所述去噪掩码包括对所述去噪掩码应用压缩函数，其中，与所述压缩函数相关联的参数是基于所述激进性控制参数值来确定的。

10.如权利要求9所述的方法，其中，所述压缩函数包括幂函数，并且其中，所述幂函数的指数是基于所...

【专利技术属性】
技术研发人员：孙俊岱，芦烈，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人