一种啸叫抑制方法、系统及车载K歌啸叫抑制装置制造方法及图纸

技术编号:38725856 阅读:18 留言:0更新日期:2023-09-08 23:18
本发明专利技术涉及一种啸叫抑制方法、系统及车载K歌啸叫抑制装置,涉及音频处理的技术领域,首先对采集的麦克风时域音频信号进行子频带划分,然后进行自适应迭代估计,在该过程中,去除原始频域麦克风音频信号的啸叫频点,从线性处理角度实现对啸叫的抑制。结合深度学习技术,构建非线性啸叫抑制模型,并训练以用于啸叫抑制,提升了在啸叫抑制中,对线性、非线性场景的拟合能力,更好地适应复杂场景及学习啸叫特征多样性,降低传统啸叫抑制方式的虚警率,避免传统去相关技术会导致的声信号失真,提升啸叫抑制效果的同时,保留人声信号的完整性,兼顾了啸叫抑制效果及声音信号保真。本发明专利技术提出的车载K歌啸叫抑制装置提升了用户车载K歌体验。车载K歌啸叫抑制装置提升了用户车载K歌体验。车载K歌啸叫抑制装置提升了用户车载K歌体验。

【技术实现步骤摘要】
一种啸叫抑制方法、系统及车载K歌啸叫抑制装置


[0001]本专利技术涉及音频处理的
,更具体地,涉及一种啸叫抑制方法、系统及车载K歌啸叫抑制装置。

技术介绍

[0002]随着汽车开发技术的发展,车载娱乐场景也逐渐多元化,K歌不再局限于唱歌娱乐场所,车载K歌也成为了热门应用。由麦克风、功放、扬声器组成基本扩声系统,在K歌场景下,用户唱歌的声音信号被麦克风拾取,通过功率放大器进行增益,最后通过扬声器播放。然而,如图1所示,扬声器用标记1表示,麦克风用标记2表示,通过扬声器播放的声音会被麦克风再次拾取,导致麦克风、扬声器之间形成反馈闭环通路,从而产生啸叫,用户会听到刺耳的啸叫声,这会大大影响K歌的体验效果,因此,采取合理的措施抑制啸叫尤为重要,当前啸叫抑制的一个整体的流程可参见图2,主要是对麦克风mic音频信号(mic,麦克风)进行回声消除、降噪后进行啸叫抑制,然后和伴奏信号混合,形成混音,经DSP(Digital Signal Processing,数字信号处理)组件传输至扬声器播放。
[0003]啸叫抑制方式主要分为两大类:被动抑制和主动抑制。其中,被动抑制是通过硬件设备减少直达以及发射声音,根据声场特性,从声场布局、声场调整、扩音系统设计、扩音设备选型等方向抑制啸叫,例如,从室内建筑声学、室内的装修、装修材料等方向来抑制啸叫,此外,还有合理地摆放麦克风和扬声器,让麦克风尽量不要正对扬声器,或者选择合适的扩声设备,如尽量选用低敏感度、高指向性的麦克风。主动抑制的方案主要有以下几个方法,分别为相位调制法、增益控制法和自适应反馈抵消法。
[0004]以上两种方式各有缺陷,被动抑制方式造价施工难度较大,并且在车内不具备普遍推广意义;主动抑制方式在软件上实施,造价低,复制性强。但目前,传统主动抑制啸叫的方式也存在问题,相位调制法算法简单,且能明显提升扩声增益,可以快速实现啸叫抑制,但对输入的声音信号进行移频或者移相的操作时,信号的音质损失很大,会导致声音信号的音质效果变差。陷波法通过在频域上预测估计啸叫频点,容易导致误检,造成虚警率高的情况,而且会将部分人声信号检测为啸叫点,导致人声特征被破坏。自适应反馈抵消法理论上若可以精确地估计出声传播路径,则可以完全地消除啸叫,但是,扬声器信号和麦克风信号一般具有一定的相关性,因此,会造成一些估计误差,利用噪声信号法、非线性处理法等去相关技术可降低两种信号的相关性,但是去相关技术会导致一定的声信号失真,因此,需要根据实际使用场景在去相关和音质之间做一个权衡。
[0005]在场景复杂以及学习啸叫特征多样性的情况下,传统啸叫抑制方式很难捕捉得到车载K歌场
[0006]景下的啸叫特征,基于深度学习的啸叫抑制解决方案通过把啸叫信号和纯净音频信号混合得到的声音信号作为训练样本,最终训练出能够抑制啸叫的网络模型。网络模型对线性、非线性场景的拟合能力都较好,因此,可以将传统啸叫抑制方式和深度学习技术相结合以达到兼容两者的优点。但是复杂的网络模型结构对平台算力依赖性比较强,消耗算
力大,需要更复杂或者更加精炼的模型才能够达到更好的效果。

技术实现思路

[0007]本专利技术的目的之一在于提供一种啸叫抑制方法,以解决当前啸叫抑制方式无法兼顾啸叫抑制效果及声音信号保真的问题,还为解决在啸叫抑制时,算力消耗大的问题,降低传统啸叫抑制方式的虚警率,提升啸叫抑制效果的同时,保留人声信号的完整性;目的之二在于提出一种啸叫抑制系统;目的之三在于提供一种车载K歌啸叫抑制装置,提升用户车载K歌体验。
[0008]为了实现上述目的,本专利技术采用的技术方案如下:
[0009]一种啸叫抑制方法,包括以下步骤:
[0010]对采集的麦克风时域音频信号进行子频带划分,获得子频带的原始麦克风时域音频信号,并将子频带的原始麦克风时域音频信号转化为原始频域麦克风音频信号;
[0011]基于原始频域麦克风音频信号进行扬声器输出信号的自适应迭代估计,去除原始频域麦克风音频信号的啸叫频点,直至达到预先设定的迭代次数,输出自适应迭代估计后的扬声器输出信号;
[0012]在自适应迭代估计中获取原始频域麦克风音频信号对应的啸叫信号,将原始频域麦克风音频信号和啸叫信号混合,获取音频混合信号;
[0013]构建非线性啸叫抑制模型;
[0014]将音频混合信号和自适应迭代估计后的扬声器输出信号作为数据集,利用数据集训练非线性啸叫抑制模型,得到训练好的非线性啸叫抑制模型;
[0015]利用训练好的非线性啸叫抑制模型进行啸叫抑制。
[0016]根据上述技术手段,首先对采集的麦克风时域音频信号进行子频带划分,以划分的方式降低计算量,避免算力消耗大,然后进行自适应迭代估计,在自适应迭代估计过程中,去除原始频域麦克风音频信号的啸叫频点,从线性处理角度实现了对啸叫的抑制。结合深度学习技术,构建非线性啸叫抑制模型并利用音频混合信号和自适应迭代估计后的扬声器输出信号进行训练,提升了在啸叫抑制中,对线性、非线性场景的拟合能力,更好地适应复杂场景及学习啸叫特征多样性,降低传统啸叫抑制方式的虚警率,避免传统去相关技术会导致的声信号失真,提升啸叫抑制效果的同时,保留人声信号的完整性,兼顾了啸叫抑制效果及声音信号保真。
[0017]进一步,设计分析滤波器对采集的麦克风时域音频信号进行子频带划分;获得子频带的原始麦克风时域音频信号,将子频带的原始麦克风时域音频信号转化为原始频域麦克风音频信号的过程包括:
[0018]统计采集的麦克风时域音频信号的啸叫声频点分布频带范围;
[0019]将啸叫声频点分布频带范围进行细化分,对非啸叫声频点分布频带范围进行粗划分,粗划分后子频带分辨率小于细化分后子频带分辨率;
[0020]利用分析滤波器进行子频带划分时,设定抽取率对麦克风时域音频信号进行信号采样,最后转化为子频带上的原始频域麦克风音频信号,过程满足表达式:
[0021][0022][0023]其中,x(n)表示采集的麦克风时域音频信号,w()表示窗函数,窗函数的长度与子频带数相等,n表示时域点,表示x(n)与窗函数w(n

mD)相乘,然后做傅里叶变换,m表示子频带上的采样点,D表示抽取率,x(m)表示划分成子频带的原始麦克风时域音频信号;h(m

qD)表示分析滤波器的系数,e
jwm
表示旋转因子,N表示总采样点数,X(m)表示麦克风时域音频信号x(n)转化至频域后,子频带上的原始频域麦克风音频信号。
[0024]根据上述技术手段,将啸叫声频点分布频带范围进行细化分,对非啸叫声频点分布频带范围进行粗划分,粗划分后子频带分辨率小于细化分后子频带分辨率,降低传统均匀细分所带来的计算量。
[0025]进一步,基于原始频域麦克风音频信号进行扬声器输出信号的自适应迭代估计的过程满足的控制传递表达式为:
[0026]Y(m)=H(z)X(m)
[0027]其中:
[0028][本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种啸叫抑制方法,其特征在于,包括以下步骤:对采集的麦克风时域音频信号进行子频带划分,获得子频带的原始麦克风时域音频信号,并将子频带的原始麦克风时域音频信号转化为原始频域麦克风音频信号;基于原始频域麦克风音频信号进行扬声器输出信号的自适应迭代估计,去除原始频域麦克风音频信号的啸叫频点,直至达到预先设定的迭代次数,输出自适应迭代估计后的扬声器输出信号;在自适应迭代估计中获取原始频域麦克风音频信号对应的啸叫信号,将原始频域麦克风音频信号和啸叫信号混合,获取音频混合信号;构建非线性啸叫抑制模型;将音频混合信号和自适应迭代估计后的扬声器输出信号作为数据集,利用数据集训练非线性啸叫抑制模型,得到训练好的非线性啸叫抑制模型;利用训练好的非线性啸叫抑制模型进行啸叫抑制。2.根据权利要求1所述的啸叫抑制方法,其特征在于,设计分析滤波器对采集的麦克风时域音频信号进行子频带划分;获得子频带的原始麦克风时域音频信号,将子频带的原始麦克风时域音频信号转化为原始频域麦克风音频信号的过程包括:统计采集的麦克风时域音频信号的啸叫声频点分布频带范围;将啸叫声频点分布频带范围进行细化分,对非啸叫声频点分布频带范围进行粗划分,粗划分后子频带分辨率小于细化分后子频带分辨率;利用分析滤波器进行子频带划分时,设定抽取率对麦克风时域音频信号进行信号采样,最后转化为子频带上的原始频域麦克风音频信号,过程满足表达式:样,最后转化为子频带上的原始频域麦克风音频信号,过程满足表达式:其中,x(n)表示采集的麦克风时域音频信号,w()表示窗函数,窗函数的长度与子频带数相等,n表示时域点,表示x(n)与窗函数w(n

mD)相乘,然后做傅里叶变换,m表示子频带上的采样点,D表示抽取率,x(m)表示划分成子频带的原始麦克风时域音频信号;h(m

qD)表示分析滤波器的系数,e
jwm
表示旋转因子,N表示总采样点数,X(m)表示麦克风时域音频信号x(n)转化至频域后,子频带上的原始频域麦克风音频信号。3.根据权利要求2所述的啸叫抑制方法,其特征在于,基于原始频域麦克风音频信号进行扬声器输出信号的自适应迭代估计的过程满足的控制传递表达式为:Y(m)=H(z)X(m)其中:其中:Y(m)表示在自适应迭代估计达到预先设定的迭代次数时的扬声器输出信号,H(z)表示
传递函数,F^(z)表示在自适应迭代过程中引入的自适应滤波器反馈,F(z)表示反馈路径,G(z)表示增益因子;在预先设定的迭代次数下,基于原始频域麦克风音频信号进行扬声器输出信号的自适应迭代估计的过程,满足表达式为:Y(m)=G(z)e(m)=G(z)(S(m)

F^(z)Y(m))=G(z)(X(m)+F(z)Y(m)

F^(z)Y(m))在达到预先设定的迭代次数后,自适应迭代估计终止,e(m)表示原始频域麦克风音频信号去除啸叫频点后得到的子频带频域信号,表达式为:e(m)=X(m)+F^(z)Y(m)

F(z)Y(m);扬声器输出信号Y(m)经过反馈路径产生的啸叫信号为F(z)Y(m),则音频混合信号为:S(m)=X(m)+F(z)Y(m)其中,S(m)表示音频混合信号。4.根据权利要求3所述的啸叫抑制方法,其特征在于,所述的非线性啸叫抑制模型包括:K个卷积层Conv、K个池化层pooling、K个激活层Relu、L个门控循环神经网络层GRU、全连接层和激活函数层,所述K个卷积层Conv、K个池化层pooling交替相连,第i个卷积层Conv通过第i个激活层Relu连接第i个池化层pooling,i=1,2,...,K,第K个池化层pooling...

【专利技术属性】
技术研发人员:王倩
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1