基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备技术方案

技术编号：33716503 阅读：98 留言：0更新日期：2022-06-06 09:01

本申请公开了一种基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备，属于音频编解码技术领域，该方法包括：确定当前帧数据对应的最大伪谱索引，并计算包含当前帧数据在内的预设多帧数据分别对应的最大伪谱索引的索引方差；计算当前帧数据对应伪谱的几何平均值和算术平均值，并计算两者的比值，作为伪谱平坦度；计算索引方差与伪谱平坦度的乘积，并作为啸叫判决因子，其中若啸叫判决因子小于预设阈值，则当前帧数据存在啸叫，开始进行啸叫抑制。本申请充分利用音频编解码器已有的信息，辅以少量的计算，得到谱平坦度，并进行啸叫的判断，与传统的频域检测与抑制相比，省略了非常消耗资源的时频转换，复杂度低，运算量少，功耗低。功耗低。功耗低。

全部详细技术资料下载

【技术实现步骤摘要】
基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备

[0001]本申请涉及音频编解码
，尤其涉及一种基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备。

技术介绍

[0002]目前主流的蓝牙音频编码器中，“子带编码技术（SBC）”是使用最为广泛，是所有的蓝牙音频设备必须支持的，但音质一般；“高级音频编码技术（AAC
‑
LC）
”ꢀ
音质较好且应用较为广泛，很多主流的手机都支持，但是其内存占用较大，且运算复杂度高，很多蓝牙设备都基于嵌入式平台，电池容量有限，处理器运算能力较差且内存有限；“高通蓝牙音频编码技术（aptX系列）”和“索尼蓝牙音频编码技术（LDAC）”，音质较好但是码率很高，且其分别为高通和索尼独有技术，较为封闭。基于上述原因，蓝牙国际联盟联合众多厂商推出了LC3，其具有较低延迟、较高音质和编码增益以及在蓝牙领域无专利费得优点，受到广大厂商的关注。
[0003]蓝牙音频有很多典型的应用场景，譬如说基于蓝牙的卡拉OK、基于蓝牙的无线麦克风/音箱等，从数据流的角度，可以抽象为图1所示，可以看出，此图中存在从扬声器到麦克风的反馈路径（如虚线箭头所示），此闭环状态使得当系统在增益增大到一定状态时有可能趋于不稳定，产生自激振荡发生啸叫，为了检测以便于进一步避免啸叫，现有技术中，可以在音频处理的路径上插入一个模块，譬如在音频编码器之前或音频解码器之后插入，用来检测啸叫的产生。现有方案中基于频域的方法检测较为准确使用广泛，但其需要完成时频变换，再基于频域得到的特征来检测啸叫...

【技术保护点】

【技术特征摘要】
1.一种基于谱平坦度的啸叫检测及抑制方法，其特征在于，包括：确定当前帧数据对应的最大伪谱索引，并计算包含所述当前帧数据在内的预设多帧数据分别对应的最大伪谱索引的索引方差；计算所述当前帧数据对应伪谱的几何平均值和算术平均值，并计算所述几何平均值和所述算术平均值的比值，并作为伪谱平坦度；计算所述索引方差与所述伪谱平坦度的乘积，并作为所述当前帧数据对应的啸叫判决因子，其中若所述啸叫判决因子小于预设阈值，则所述当前帧数据存在啸叫，开始进行啸叫抑制。2.根据权利要求1所述的基于谱平坦度的啸叫检测及抑制方法，其特征在于，所述确定当前帧数据对应的最大伪谱索引，包括：利用LC3标准解码方法对所述当前帧数据进行解码，获取谱系数；根据所述谱系数计算对应的伪谱，并确定所述当前帧数据对应的所述最大伪谱索引。3.根据权利要求1所述的基于谱平坦度的啸叫检测及抑制方法，其特征在于，所述计算所述当前帧数据对应伪谱的几何平均值和算术平均值，并计算所述几何平均值和所述算术平均值的比值，并作为伪谱平坦度，包括：对所述当前帧数据进行子带划分，并确定所述最大伪谱索引所在的音频子带；计算所述音频子带对应的多个伪谱的所述几何平均值和所述算术平均值。4.根据权利要求1所述的基于谱平坦度的啸叫检测及抑制方法，其特征在于，在所述确定当前帧数据对应的最大伪谱索引之前，还包括：获取所述当前帧数据的基音存在标志；在所述基音存在标志表示所述当前帧数据存在基音的条件下，确定所述当前帧数据对应的所述最大伪谱索引。5.根据权利要求1所述的基于谱平坦度的啸叫检测及抑...

【专利技术属性】
技术研发人员：李强，朱勇，王尧，叶东翔，
申请(专利权)人：北京百瑞互联技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人