一种啸叫抑制方法、系统及车载K歌啸叫抑制装置制造方法及图纸

技术编号：38725856 阅读：18 留言：0更新日期：2023-09-08 23:18

本发明专利技术涉及一种啸叫抑制方法、系统及车载K歌啸叫抑制装置，涉及音频处理的技术领域，首先对采集的麦克风时域音频信号进行子频带划分，然后进行自适应迭代估计，在该过程中，去除原始频域麦克风音频信号的啸叫频点，从线性处理角度实现对啸叫的抑制。结合深度学习技术，构建非线性啸叫抑制模型，并训练以用于啸叫抑制，提升了在啸叫抑制中，对线性、非线性场景的拟合能力，更好地适应复杂场景及学习啸叫特征多样性，降低传统啸叫抑制方式的虚警率，避免传统去相关技术会导致的声信号失真，提升啸叫抑制效果的同时，保留人声信号的完整性，兼顾了啸叫抑制效果及声音信号保真。本发明专利技术提出的车载K歌啸叫抑制装置提升了用户车载K歌体验。车载K歌啸叫抑制装置提升了用户车载K歌体验。车载K歌啸叫抑制装置提升了用户车载K歌体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种啸叫抑制方法、系统及车载K歌啸叫抑制装置

[0001]本专利技术涉及音频处理的
，更具体地，涉及一种啸叫抑制方法、系统及车载K歌啸叫抑制装置。

技术介绍

[0002]随着汽车开发技术的发展，车载娱乐场景也逐渐多元化，K歌不再局限于唱歌娱乐场所，车载K歌也成为了热门应用。由麦克风、功放、扬声器组成基本扩声系统，在K歌场景下，用户唱歌的声音信号被麦克风拾取，通过功率放大器进行增益，最后通过扬声器播放。然而，如图1所示，扬声器用标记1表示，麦克风用标记2表示，通过扬声器播放的声音会被麦克风再次拾取，导致麦克风、扬声器之间形成反馈闭环通路，从而产生啸叫，用户会听到刺耳的啸叫声，这会大大影响K歌的体验效果，因此，采取合理的措施抑制啸叫尤为重要，当前啸叫抑制的一个整体的流程可参见图2，主要是对麦克风mic音频信号(mic，麦克风)进行回声消除、降噪后进行啸叫抑制，然后和伴奏信号混合，形成混音，经DSP(Digital Signal Processing，数字信号处理)组件传输至扬声器播放。
[0003]啸叫抑制方式主要分为两大类：被动抑制和主动抑制。其中，被动抑制是通过硬件设备减少直达以及发射声音，根据声场特性，从声场布局、声场调整、扩音系统设计、扩音设备选型等方向抑制啸叫，例如，从室内建筑声学、室内的装修、装修材料等方向来抑制啸叫，此外，还有合理地摆放麦克风和扬声器，让麦克风尽量不要正对扬声器，或者选择合适的扩声设备，如尽量选用低敏感度、高指向性的麦克风。主动抑制的方案主要有以下几个方法，分别为相位调制法、增...

【技术保护点】

【技术特征摘要】
1.一种啸叫抑制方法，其特征在于，包括以下步骤：对采集的麦克风时域音频信号进行子频带划分，获得子频带的原始麦克风时域音频信号，并将子频带的原始麦克风时域音频信号转化为原始频域麦克风音频信号；基于原始频域麦克风音频信号进行扬声器输出信号的自适应迭代估计，去除原始频域麦克风音频信号的啸叫频点，直至达到预先设定的迭代次数，输出自适应迭代估计后的扬声器输出信号；在自适应迭代估计中获取原始频域麦克风音频信号对应的啸叫信号，将原始频域麦克风音频信号和啸叫信号混合，获取音频混合信号；构建非线性啸叫抑制模型；将音频混合信号和自适应迭代估计后的扬声器输出信号作为数据集，利用数据集训练非线性啸叫抑制模型，得到训练好的非线性啸叫抑制模型；利用训练好的非线性啸叫抑制模型进行啸叫抑制。2.根据权利要求1所述的啸叫抑制方法，其特征在于，设计分析滤波器对采集的麦克风时域音频信号进行子频带划分；获得子频带的原始麦克风时域音频信号，将子频带的原始麦克风时域音频信号转化为原始频域麦克风音频信号的过程包括：统计采集的麦克风时域音频信号的啸叫声频点分布频带范围；将啸叫声频点分布频带范围进行细化分，对非啸叫声频点分布频带范围进行粗划分，粗划分后子频带分辨率小于细化分后子频带分辨率；利用分析滤波器进行子频带划分时，设定抽取率对麦克风时域音频信号进行信号采样，最后转化为子频带上的原始频域麦克风音频信号，过程满足表达式：样，最后转化为子频带上的原始频域麦克风音频信号，过程满足表达式：其中，x(n)表示采集的麦克风时域音频信号，w()表示窗函数，窗函数的长度与子频带数相等，n表示时域点，表示x(n)与窗函数w(n
‑
mD)相乘，然后做傅里叶变换，m表示子频带上的采样点，D表示抽取率，x(m)表示划分成子频带的原始麦克风时域音频信号；h(m
‑
qD)表示分析滤波器的系数，e
jwm
表示旋转因子，N表示总采样点数，X(m)表示麦克风时域音频信号x(n)转化至频域后，子频带上的原始频域麦克风音频信号。3.根据权利要求2所述的啸叫抑制方法，其特征在于，基于原始频域麦克风音频信号进行扬声器输出信号的自适应迭代估计的过程满足的控制传递表达式为：Y(m)＝H(z)X(m)其中：其中：Y(m)表示在自适应迭代估计达到预先设定的迭代次数时的扬声器输出信号，H(z)表示
传递函数，F^(z)表示在自适应迭代过程中引入的自适应滤波器反馈，F(z)表示反馈路径，G(z)表示增益因子；在预先设定的迭代次数下，基于原始频域麦克风音频信号进行扬声器输出信号的自适应迭代估计的过程，满足表达式为：Y(m)＝G(z)e(m)＝G(z)(S(m)
‑
F^(z)Y(m))＝G(z)(X(m)+F(z)Y(m)
‑
F^(z)Y(m))在达到预先设定的迭代次数后，自适应迭代估计终止，e(m)表示原始频域麦克风音频信号去除啸叫频点后得到的子频带频域信号，表达式为：e(m)＝X(m)+F^(z)Y(m)
‑
F(z)Y(m)；扬声器输出信号Y(m)经过反馈路径产生的啸叫信号为F(z)Y(m)，则音频混合信号为：S(m)＝X(m)+F(z)Y(m)其中，S(m)表示音频混合信号。4.根据权利要求3所述的啸叫抑制方法，其特征在于，所述的非线性啸叫抑制模型包括：K个卷积层Conv、K个池化层pooling、K个激活层Relu、L个门控循环神经网络层GRU、全连接层和激活函数层，所述K个卷积层Conv、K个池化层pooling交替相连，第i个卷积层Conv通过第i个激活层Relu连接第i个池化层pooling，i＝1，2，...，K，第K个池化层pooling...

【专利技术属性】
技术研发人员：王倩，
申请(专利权)人：重庆长安汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人