【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及用于控制语音增强中的语音保留的系统、方法和介质。
技术介绍
1、例如,去噪技术可以应用于有噪声音频信号,以生成去噪的或纯净的音频信号。然而,执行去噪技术可能很困难,特别是对于各种类型的音频内容,比如包括音乐、多个说话者之间的对话或交谈、音乐和语音的混合等的音频内容。
2、符号和术语
3、在整个本公开中,包括在权利要求书中,术语“扬声器(speaker)”、“扩音器(loudspeaker)”和“音频再现换能器”同义地用于表示任何发声换能器(或一组换能器)。一套典型的耳机包括两个扬声器。扬声器可以被实施为包括多个换能器(例如,低音扬声器和高音扬声器),所述换能器可以由单个公共扬声器馈送或多个扬声器馈送驱动。在一些示例中,(多个)扬声器馈送可以在耦接到不同换能器的不同电路分支中经历不同处理。
4、在整个本公开中,包括在权利要求中,在广义上使用“对”信号或数据执行操作的表达(例如,对信号或数据进行滤波、缩放、变换或应用增益)来表示直接对信号或数据执行操作或对信号或数据的已处理版本(例如,在对其执行
...【技术保护点】
1.一种对音频信号执行去噪的方法,包括:
2.如权利要求1所述的方法,其中,生成所述有噪声音频信号的频域表示包括:
3.如权利要求1或2中任一项所述的方法,其中,修改在所述训练集中包括的所述目标去噪掩码包括对所述目标去噪掩码中的目标去噪掩码应用幂函数,并且其中,所述幂函数的指数是基于所述激进性控制参数值来确定的。
4.如权利要求1至3中任一项所述的方法,其中,所述机器学习模型包括卷积神经网络(CNN),并且其中,确定所述机器学习模型的架构包括基于所述激进性控制参数值来确定所述CNN的卷积块的滤波器大小。
5.如权利要求1
...【技术特征摘要】
【国外来华专利技术】
1.一种对音频信号执行去噪的方法,包括:
2.如权利要求1所述的方法,其中,生成所述有噪声音频信号的频域表示包括:
3.如权利要求1或2中任一项所述的方法,其中,修改在所述训练集中包括的所述目标去噪掩码包括对所述目标去噪掩码中的目标去噪掩码应用幂函数,并且其中,所述幂函数的指数是基于所述激进性控制参数值来确定的。
4.如权利要求1至3中任一项所述的方法,其中,所述机器学习模型包括卷积神经网络(cnn),并且其中,确定所述机器学习模型的架构包括基于所述激进性控制参数值来确定所述cnn的卷积块的滤波器大小。
5.如权利要求1至3中任一项所述的方法,其中,所述机器学习模型包括u-net,并且其中,确定所述机器学习模型的架构包括基于所述激进性控制参数值来确定所述u-net的深度。
6.如权利要求1至5中任一项所述的方法,其中,确定所述损失包括对所述预测去噪掩码相对于所述目标去噪掩码的误差应用惩罚权重,并且其中,所述惩罚权重是至少部分地基于所述激进性控制参数值来确定的。
7.如权利要求6所述的方法,其中,所述惩罚权重至少部分地基于与所述训练样本相关联的对应有噪声音频信号是否包括语音。
8.一种对音频信号执行去噪的方法,所述方法包括:
9.如权利要求8所述的方法,其中,修改所述去噪掩码包括对所述去噪掩码应用压缩函数,其中,与所述压缩函数相关联的参数是基于所述激进性控制参数值来确定的。
10.如权利要求9所述的方法,其中,所述压缩函数包括幂函数,并且其中,所述幂函数的指数是基于所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。