基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备技术方案

技术编号:33716503 阅读:98 留言:0更新日期:2022-06-06 09:01
本申请公开了一种基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备,属于音频编解码技术领域,该方法包括:确定当前帧数据对应的最大伪谱索引,并计算包含当前帧数据在内的预设多帧数据分别对应的最大伪谱索引的索引方差;计算当前帧数据对应伪谱的几何平均值和算术平均值,并计算两者的比值,作为伪谱平坦度;计算索引方差与伪谱平坦度的乘积,并作为啸叫判决因子,其中若啸叫判决因子小于预设阈值,则当前帧数据存在啸叫,开始进行啸叫抑制。本申请充分利用音频编解码器已有的信息,辅以少量的计算,得到谱平坦度,并进行啸叫的判断,与传统的频域检测与抑制相比,省略了非常消耗资源的时频转换,复杂度低,运算量少,功耗低。功耗低。功耗低。

【技术实现步骤摘要】
基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备


[0001]本申请涉及音频编解码
,尤其涉及一种基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备。

技术介绍

[0002]目前主流的蓝牙音频编码器中,“子带编码技术(SBC)”是使用最为广泛,是所有的蓝牙音频设备必须支持的,但音质一般;“高级音频编码技术(AAC

LC)
”ꢀ
音质较好且应用较为广泛,很多主流的手机都支持,但是其内存占用较大,且运算复杂度高,很多蓝牙设备都基于嵌入式平台,电池容量有限,处理器运算能力较差且内存有限;“高通蓝牙音频编码技术(aptX系列)”和“索尼蓝牙音频编码技术(LDAC)”,音质较好但是码率很高,且其分别为高通和索尼独有技术,较为封闭。基于上述原因,蓝牙国际联盟联合众多厂商推出了LC3,其具有较低延迟、较高音质和编码增益以及在蓝牙领域无专利费得优点,受到广大厂商的关注。
[0003]蓝牙音频有很多典型的应用场景,譬如说基于蓝牙的卡拉OK、基于蓝牙的无线麦克风/音箱等,从数据流的角度,可以抽象为图1所示,可以看出,此图中存在从扬声器到麦克风的反馈路径(如虚线箭头所示),此闭环状态使得当系统在增益增大到一定状态时有可能趋于不稳定,产生自激振荡发生啸叫,为了检测以便于进一步避免啸叫,现有技术中,可以在音频处理的路径上插入一个模块,譬如在音频编码器之前或音频解码器之后插入,用来检测啸叫的产生。现有方案中基于频域的方法检测较为准确使用广泛,但其需要完成时频变换,再基于频域得到的特征来检测啸叫,并完成抑制,最后再将频域信号转换为时域信号,运算量较大,导致设备功耗增大,对蓝牙设备,特别是蓝牙接收器设备的续航能力造成较大的影响。

技术实现思路

[0004]针对现有技术中,在进行啸叫检测和抑制过程中,需要在音频处理的路径上插入一个啸叫检测模块,处理过程复杂,功耗高,运算量大,不适合在低功耗蓝牙中应用的问题,本申请提出一种基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备。
[0005]第一方面,本申请提供一种基于谱平坦度的啸叫检测及抑制方法,包括:确定当前帧数据对应的最大伪谱索引,并计算包含当前帧数据在内的预设多帧数据分别对应的最大伪谱索引的索引方差;计算当前帧数据对应伪谱的几何平均值和算术平均值,并计算几何平均值和算术平均值的比值,并作为伪谱平坦度;计算索引方差与伪谱平坦度的乘积,并作为当前帧数据对应的啸叫判决因子,其中若啸叫判决因子小于预设阈值,则当前帧数据存在啸叫,开始进行啸叫抑制。
[0006]可选的,确定当前帧数据对应的最大伪谱索引,包括:利用LC3标准解码方法对当前帧数据进行解码,获取谱系数;根据谱系数计算对应的伪谱,并确定当前帧数据对应的最大伪谱索引。
[0007]可选的,计算当前帧数据对应伪谱的几何平均值和算术平均值,并计算几何平均
值和算术平均值的比值,并作为伪谱平坦度,包括:对当前帧数据进行子带划分,并确定最大伪谱索引所在的音频子带;计算得到音频子带对应的多个伪谱的几何平均值和算术平均值。
[0008]可选的,在确定当前帧数据对应的最大伪谱索引之前,还包括:获取当前帧数据的基音存在标志;在基音存在标志表示当前帧数据存在基音的条件下,确定当前帧数据对应的最大伪谱索引。
[0009]可选的,开始进行啸叫抑制,包括:生成变速随机数,并根据变速随机数调整当前帧数据的采样率;通过调整后的采样率对当前帧数据进行播放,进行啸叫抑制。
[0010]可选的,还包括:在对当前帧数据的下一帧数据进行播放时,根据变速随机数生成补偿随机数;根据补偿随机数对下一帧数据对应的采样率进行更新,并利用更新后的采样率对下一帧数据进行播放。
[0011]第二方面,本申请提供一种基于谱平坦度的啸叫检测及抑制系统,包括:索引方差确定模块,其确定当前帧数据对应的最大伪谱索引,并计算包含当前帧数据在内的预设多帧数据分别对应的最大伪谱索引的索引方差;伪谱平坦度确定模块,其计算当前帧数据对应伪谱的几何平均值和算术平均值,并计算几何平均值和算术平均值的比值,并作为伪谱平坦度;啸叫确定及抑制模块,其计算索引方差与伪谱平坦度的乘积,并作为当前帧数据对应的啸叫判决因子,其中若啸叫判决因子小于预设阈值,则当前帧数据存在啸叫,开始进行啸叫抑制。
[0012]第三方面,本申请提供一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行方案一中的基于谱平坦度的啸叫检测及抑制方法。
[0013]第四方面,本申请提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中:处理器操作计算机指令以执行方案一中的基于谱平坦度的啸叫检测及抑制方法。
[0014]本申请的有益效果是:本申请基于谱平坦度的啸叫检测及抑制方法,充分利用音频编解码器已有的信息,辅以少量的计算,得到谱平坦度,并进行啸叫的判断,与传统的频域检测与抑制相比,省略了非常消耗资源的时频转换,复杂度低,运算量少,功耗低,适用于在低功耗蓝牙中的应用。
附图说明
[0015]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0016]图1是蓝牙音频啸叫发生过程示意图;图2是本申请基于谱平坦度的啸叫检测及抑制方法的一个实施方式的示意图;图3是本申请啸叫抑制过程的一个实例的示意图;图4是白噪声、人声以及包含啸叫的人声的三段音频波形示意图;图5是与图4中三段音频对应的语谱图;图6是与图4中三段音频对应的最大索引示意图;
图7是与图4中三段音频对应的最大索引方差示意图;图8是与图4中三段音频对应的啸叫判决因子的示意图;图9是含啸叫的人声啸叫判决因子和不含啸叫的人声啸叫判决因子的对比示意图;图10是本申请基于谱平坦度的啸叫检测及抑制系统的一个实施方式。
[0017]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0018]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0019]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于谱平坦度的啸叫检测及抑制方法,其特征在于,包括:确定当前帧数据对应的最大伪谱索引,并计算包含所述当前帧数据在内的预设多帧数据分别对应的最大伪谱索引的索引方差;计算所述当前帧数据对应伪谱的几何平均值和算术平均值,并计算所述几何平均值和所述算术平均值的比值,并作为伪谱平坦度;计算所述索引方差与所述伪谱平坦度的乘积,并作为所述当前帧数据对应的啸叫判决因子,其中若所述啸叫判决因子小于预设阈值,则所述当前帧数据存在啸叫,开始进行啸叫抑制。2.根据权利要求1所述的基于谱平坦度的啸叫检测及抑制方法,其特征在于,所述确定当前帧数据对应的最大伪谱索引,包括:利用LC3标准解码方法对所述当前帧数据进行解码,获取谱系数;根据所述谱系数计算对应的伪谱,并确定所述当前帧数据对应的所述最大伪谱索引。3.根据权利要求1所述的基于谱平坦度的啸叫检测及抑制方法,其特征在于,所述计算所述当前帧数据对应伪谱的几何平均值和算术平均值,并计算所述几何平均值和所述算术平均值的比值,并作为伪谱平坦度,包括:对所述当前帧数据进行子带划分,并确定所述最大伪谱索引所在的音频子带;计算所述音频子带对应的多个伪谱的所述几何平均值和所述算术平均值。4.根据权利要求1所述的基于谱平坦度的啸叫检测及抑制方法,其特征在于,在所述确定当前帧数据对应的最大伪谱索引之前,还包括:获取所述当前帧数据的基音存在标志;在所述基音存在标志表示所述当前帧数据存在基音的条件下,确定所述当前帧数据对应的所述最大伪谱索引。5.根据权利要求1所述的基于谱平坦度的啸叫检测及抑...

【专利技术属性】
技术研发人员:李强朱勇王尧叶东翔
申请(专利权)人:北京百瑞互联技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1