本底噪声估计和噪声降低制造技术

技术编号:34764184 阅读:24 留言:0更新日期:2022-08-31 19:09
公开了本底噪声估计和噪声降低,在实施例中,一种方法包括:获得音频信号;将音频信号划分到多个缓冲区中;确定音频信号的每个缓冲区的时频样本;针对每个缓冲区和每个频率,基于缓冲区中的样本和相邻缓冲区中的样本确定能量中值(或均值)和能量变化量的量度,缓冲区中的样本和相邻缓冲区中的样本一起跨越音频信号的指定时间范围;将中值(或均值)和能量变化量的量度组合为成本函数;针对每个频率:确定与成本函数的最小值相对应的音频信号的特定缓冲区的信号能量;选择信号能量作为音频信号的估计的本底噪声;以及使用估计的本底噪声来降低音频信号中的噪声。降低音频信号中的噪声。降低音频信号中的噪声。

【技术实现步骤摘要】
【国外来华专利技术】本底噪声估计和噪声降低
[0001]相关申请的交叉引用
[0002]本申请要求以下优先申请的优先权:于2020年1月21日提交的西班牙申请P202030040(参考号:D19149ES)、于2020年3月26日提交的美国临时申请63/000,223(参考号:D19149USP1)和于2020年11月23日提交的美国临时申请63/117,313(参考号:D19149USP2),这些申请通过引用并入本文。


[0003]本公开总体上涉及音频信号处理。

技术介绍

[0004]与专业场景不同,背景噪声是用户生成的音频内容(UGC)中的潜在问题,这是由于所用设备的限制和录音发生处的不受控的声学环境导致的。这样的背景噪声除了令人困扰以外,还可能会被对音频内容应用大量动态范围压缩和均衡的处理工具变得甚至更大声。因此,为降低背景噪声,噪声降低是音频处理链中的关键元素。噪声降低依赖于成功测量本底噪声,所述本底噪声可以通过分析仅包含背景噪声的录音片段的功率谱来获得。这样的片段可以由用户手动识别,可以自动找到,或者可以通过要求执行者/说活者在录音的前几秒期间保持安静来获得。然而,仍存在无法获得仅包含噪声的音频内容片段的场景。
[0005]在例如因为信号存在于不同时间不同频率处而不存在这样的片段的情况下,基于(手动或自动)找到音频的安静片段的现有方法失效。其他方法基于将音频频谱与穿过最小值的光滑曲线拟合。这样的方法通常会丢弃噪声的窄带音调分量,如电嗡嗡声。基于计算每个频率处的电平分布并将分布的低百分比(例如,10%百分比)选择为噪声的其他方法对于例如信号的淡入和淡出是不稳健的。最后,其他方法依赖于关于信号的性质的假设(例如,假设信号是语音),并且因此,不能推广到所有类型的音频信号。

技术实现思路

[0006]公开了本底噪声估计和噪声降低的实施方式。
[0007]在实施例中,一种方法包括:获得音频信号;将所述音频信号划分到多个缓冲区中;确定所述音频信号的每个缓冲区的时频样本;针对每个缓冲区和每个频率,基于所述缓冲区中的样本和相邻缓冲区中的样本确定能量变化量的量度和中值,所述缓冲区中的样本和相邻缓冲区中的样本一起跨越所述音频信号的指定时间范围;将所述中值和所述能量变化量的量度组合为成本函数;针对每个频率:确定与所述成本函数的最小值相对应的所述音频信号的特定缓冲区的信号能量;选择所述信号能量作为所述音频信号的估计的本底噪声;以及使用所述估计的本底噪声来降低所述音频信号中的噪声。
[0008]在实施例中,确定均值而不是中值。
[0009]在实施例中,变化量的量度和中值或均值被缩放到0.0与1.0之间。
[0010]在实施例中,变化量与均值或中值的组合是其值之和加上其乘积与1之和的倒数。
[0011]在实施例中,变化量与中值或均值的组合是其平方值之和。
[0012]在实施例中,变化量与中值或均值的组合是中值或均值的平方与能量方差的sigmoid之和。
[0013]在实施例中,变化量与中值或均值的组合是中值或均值与方差的sigmoid之和。
[0014]在实施例中,将变化量替换为跨越指定时间范围内的缓冲区上的能量最大值与跨越指定时间范围内的缓冲区上的能量最小值之间的差。
[0015]在实施例中,具有对音频信号的块计算的方差以及中值或均值的缓冲区包括总体信号能量低于预定义阈值的至少一个缓冲区,并且所述至少一个缓冲区不用于估计音频信号的本底噪声。
[0016]在实施例中,预定义阈值是相对于音频信号的最大电平确定的。
[0017]在实施例中,预定义阈值是相对于音频信号的平均电平确定的。
[0018]在实施例中,所述方法进一步包括:使用一个或多个处理器分析所述音频信号的块的分布,根据所述分布估计每个频率处的本底噪声;选择块k和频率f;以及如果增大的成本小于第二预定义阈值,则用从块k计算的值替换频率f处的估计噪声。
[0019]在实施例中,所述方法进一步包括根据所选择的缓冲区处的能量变化量的值确定置信度值。
[0020]在实施例中,置信度值在频率上被平滑。
[0021]在实施例中,降低音频信号中的噪声进一步包括在每个频率处应用增益降低,所述增益降低随所述频率处的置信度值减小。
[0022]在实施例中,所述方法进一步包括:使用一个或多个处理器选择频率f1;使用一个或多个处理器,针对高于所选择的频率f1的具有预定大小的所有区间,计算具有预定义大小的段中频谱的离散导数的平均值;使用一个或多个处理器在最大负导数小于预定义值时选择具有所述负值的段作为截止频率f
c
;以及使用一个或多个处理器将高于所述截止频率的频谱值替换为具有与所述截止频率相邻的上边界的预定义长度的频带中频谱的平均值。
[0023]在实施例中,所述成本函数随着中值或均值的增大而增大,并且随着所述能量变化量的量度的增大而增大。
[0024]在实施例中,所述成本函数是非线性的。
[0025]在实施例中,所述成本函数在能量变化量的量度和所述均值或中值上是对称的。
[0026]在实施例中,所述成本函数是不对称的,并且当所述能量变化量的量度小于预定义阈值时,所述能量变化量的量度的权重小于所述均值或中值的权重。
[0027]在实施例中,一种系统包括:一个或多个处理器;以及非暂态计算机可读介质,所述非暂态计算机可读介质存储有指令,所述指令在由所述一个或多个处理器执行时使所述一个或多个处理器执行前述方法中任何一个的操作。
[0028]在实施例中,一种非暂态计算机可读介质存储有指令,所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行前述方法中任何一个的操作。
[0029]本文公开的其他实施方式涉及系统、装置和计算机可读介质。下文的附图和描述中阐述了所公开的实施方式的细节。根据本说明书、附图和权利要求,其他特征、目的和优点是显而易见的。
[0030]本文公开的特定实施方式提供了以下优点中的一个或多个。在音频信号的本底噪
声的可靠估计不可获得的情况下(例如,仅有背景噪声的片段),可以使用所公开的系统和方法来估计本底噪声。与现有解决方案不同,所公开的系统和方法不丢弃音频信号的窄带音调分量(例如,电嗡嗡声)并且对于例如音频信号的淡入和淡出是稳健的。此外,不需要对音频信号的性质进行假设,这允许所公开的系统和方法应用于所有类型的音频信号。
附图说明
[0031]在附图中,为了便于描述,示出了示意性元件的特定布置或排序,如那些表示设备、单元、指令块和数据元件的示意性元件。然而,本领域技术人员应当理解,附图中示意性元件的特定排序或布置并不意味着需要特定处理次序或顺序,或者处理分离。进一步地,在附图中包括示意性元件并不意味着在所有实施例中都需要这种元件,或者在一些实施方式中,由这种元件表示的特征可以不包括在其他元件中或与其他元件组合。
[0032]进一步地,在使用如实线或虚线或箭头等连接元本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种估计音频信号的本底噪声的方法,所述方法包括:使用一个或多个处理器获得音频信号;使用所述一个或多个处理器将所述音频信号划分到多个缓冲区中;使用所述一个或多个处理器确定所述音频信号的每个缓冲区的时频样本;针对每个缓冲区和每个频率,使用所述一个或多个处理器基于所述缓冲区中的样本和相邻缓冲区中的样本确定能量变化量的量度和中值,所述缓冲区中的样本和相邻缓冲区中的样本一起跨越所述音频信号的指定时间范围;使用所述一个或多个处理器将所述变化量的量度和所述中值或均值组合为成本函数;针对每个频率:使用所述一个或多个处理器确定与所述成本函数的最小值相对应的所述音频信号的特定缓冲区的信号能量;使用所述一个或多个处理器选择所述信号能量作为所述音频信号的估计的本底噪声;以及使用所述一个或多个处理器和所述估计的本底噪声来降低所述音频信号中的噪声。2.如权利要求1所述的方法,其中,所述能量变化量的量度和中值或均值被缩放到0.0与1.0之间。3.如权利要求1或2所述的方法,其中,所述成本函数随着中值或均值的增大而增大,并且随着所述能量变化量的量度的增大而增大。4.如权利要求1或2所述的方法,其中,所述成本函数是非线性的。5.如权利要求1或2所述的方法,其中,所述成本函数在所述变化量的量度和均值或中值上是对称的。6.如权利要求1或2所述的方法,其中,所述成本函数是不对称的,并且当所述能量变化量的量度小于预定义阈值时,所述能量变化量的量度的权重小于所述均值或中值的权重。7.如权利要求1或2所述的方法,其中,所述能量变化量的量度是:标准偏差;或者跨越所述指定时间范围内的缓冲区上的能量最大值与跨越所述指定时间范围内的缓冲区上的能量最小值之间的差。8.如权利要求7所述的方法,其中,所述变化量的量度与均值或中值的组合是其平方值之和加上其乘积与1之和的倒数。9.如权利要求7所述的方法,其中,所述变化量的量度与所述中值或均值的组合是其平方值之和。10.如权利要求7所述的方法,其中,所述能量量的量度与中值或均值的组合是所述中值或均值的平方与所述变化量的量度的sigmoid。11.如权利要求7所述的方法,其中,所述变化量的量度与中值或均值的组合是所述中值或均值与所述变化量的量度的sigmoid之...

【专利技术属性】
技术研发人员:G
申请(专利权)人:杜比国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1