使用机器学习的降噪制造技术

技术编号:37456801 阅读:40 留言:0更新日期:2023-05-06 09:28
一种降噪的方法包括使用神经网络控制维纳滤波器。由神经网络估计的增益与由维纳滤波器产生的增益相结合。以这种方式,与仅使用神经网络相比,降噪系统提供了改进的结果。降噪系统提供了改进的结果。降噪系统提供了改进的结果。

【技术实现步骤摘要】
【国外来华专利技术】使用机器学习的降噪
[0001]相关申请的交叉引用
[0002]本申请要求2020年11月11日提交的欧洲专利申请号20206921.7、2020年11月5日提交的美国临时专利申请号63/110,114、2020年8月20日提交的美国临时专利申请号63/068,227和2020年7月31日提交的国际专利申请号PCT/CN2020/106270的优先权,所述申请中的所有申请在此通过引用将其并入本文。


[0003]本公开涉及音频处理,并且具体涉及降噪。

技术介绍

[0004]除非本文另有说明,否则本节中描述的方法不是本申请中的权利要求的现有技术,并且不因被包含在本节中而被承认是现有技术。
[0005]在移动设备中实现降噪具有挑战性。移动设备可以在各种用例(包括语音通信、用户生成内容的开发等)中捕获静态和非静态噪声两者。移动设备可能在功率消耗和处理能力方面受到限制,从而导致对于开发在由移动设备实现时有效的降噪过程的挑战。

技术实现思路

[0006]鉴于上述情况,需要开发一种在移动设备中工作良好的降噪系统。...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的音频处理的方法,所述方法包括:使用机器学习模型生成音频信号的第一频带增益和语音活动检测值;基于所述第一频带增益和所述语音活动检测值生成背景噪声估计;通过使用由所述背景噪声估计控制的维纳滤波器处理所述音频信号来生成第二频带增益;通过组合所述第一频带增益和所述第二频带增益来生成组合增益;以及通过使用所述组合增益修改所述音频信号来生成经修改的音频信号。2.如权利要求1所述的方法,其中,所述机器学习模型是使用数据扩充生成的,以增加训练数据的多样性。3.如权利要求1

2中任一项所述的方法,其中,生成所述第一频带增益包括使用针对至少两个不同频带的至少两个不同限制来限制所述第一频带增益。4.如权利要求1

3中任一项所述的方法,其中,生成所述背景噪声估计是基于噪声帧的数量超过针对特定频带的阈值的。5.如权利要求1

4中任一项所述的方法,其中,生成所述第二频带增益包括基于特定频带的稳态噪声水平来使用所述维纳滤波器。6.如权利要求1

5中任一项所述的方法,其中,生成所述第二频带增益包括使用针对至少两个不同频带的至少两个不同限制来限制所述第二频带增益。7.如权利要求1

6中任一项所述的方法,其中,生成所述组合增益包括:将所述第一频带增益和所述第二频带增益相乘;以及使用针对至少两个不同频带的至少两个不同限制来限制所述组合频带增益。8.如权利要求1

7中任一项所述的方法,其中,生成所述经修改的音频信号包括使用所述组合频带增益修改所述音频信号的幅度谱。9.如权利要求1

8中任一项所述的方法,还包括:将重叠窗口应用于输入音频信号以生成多个帧,其中,所述...

【专利技术属性】
技术研发人员:双志伟
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1