一种蓝牙音频啸叫抑制方法、装置、介质及蓝牙设备制造方法及图纸

技术编号:31848274 阅读:25 留言:0更新日期:2022-01-12 13:30
本申请公开了一种蓝牙音频啸叫抑制方法、装置、介质及蓝牙设备,属于音频编解码技术领域。本申请主要包括,利用包括大量纯净音频谱系数及相应含啸叫音频谱系数的训练集,对神经网络模型进行离线训练得到啸叫抑制神经网络模型;在蓝牙音频编码和/或解码过程中,利用经离散余弦变换得到的当前帧音频谱系数得到当前帧特征向量;以及将当前帧特征向量作为输入,利用啸叫抑制神经网络模型输出无啸叫的当前帧音频谱系数,或者抑制啸叫后的当前帧音频谱系数。本申请能在达到较好的啸叫抑制功效的同时,能够降低系统复杂度,减少运算量,降低系统延时,提升用户体验。提升用户体验。提升用户体验。

【技术实现步骤摘要】
一种蓝牙音频啸叫抑制方法、装置、介质及蓝牙设备


[0001]本申请涉及音频编解码
,尤其涉及一种蓝牙音频啸叫抑制方法、装置、介质及蓝牙设备。

技术介绍

[0002]蓝牙音频有很多典型的应用场景,譬如说基于蓝牙的卡拉OK、基于蓝牙的无线麦克风/音箱等,从数据流的角度,可以抽象为图1所示,可以看出,此图中存在从扬声器到麦克风的反馈路径(如虚线箭头所示),此闭环状态使得当系统在增益增大到一定状态时有可能趋于不稳定,产生自激振荡发生啸叫。为了避免啸叫,可以基于深度学习对啸叫进行抑制。现有技术中基于深度学习抑制啸叫时均需要将音频数据转换到频域,或者借助其他额外的硬件设备,系统复杂,运算量大,不利于具体实施。

技术实现思路

[0003]针对现有技术存在的问题,本申请主要提供一种蓝牙音频啸叫抑制方法、装置、介质及蓝牙设备,通过利用编解码过程中的纯净音频谱系数及含啸叫音频谱系数训练神经网络模型,进一步利用训练好的申请网络模型抑制啸叫,能够降低系统复杂度,减少运算量,降低系统延时,提升用户体验。
[0004]为了实现上述目的,本申请采用的一个技术方案是:提供一种蓝牙音频啸叫抑制方法,其包括:利用包括大量纯净音频谱系数及相应含啸叫音频谱系数的训练集,对神经网络模型进行离线训练得到啸叫抑制神经网络模型;在蓝牙音频编码和/或解码过程中,利用经离散余弦变换得到的当前帧音频谱系数得到当前帧特征向量;以及将当前帧特征向量作为输入,利用啸叫抑制神经网络模型输出无啸叫的当前帧音频谱系数,或者抑制啸叫后的当前帧音频谱系数;其中,纯净音频谱系数及相应含啸叫音频谱系数包括,对纯净音频信号以及含啸叫音频信号进行蓝牙音频编码和/或解码时,经离散余弦变换步骤得到的音频谱系数。
[0005]本申请采用的另一个技术方案是:提供一种蓝牙音频啸叫抑制装置,其包括,模型训练模块,用于利用包括大量纯净音频谱系数及相应含啸叫音频谱系数的训练集,对神经网络模型进行离线训练得到啸叫抑制神经网络模型;特征提取模块,用于在蓝牙音频编码和/或解码过程中,利用经离散余弦变换得到的当前帧音频谱系数得到当前帧特征向量;以及啸叫抑制模块,用于将当前帧特征向量作为输入,利用啸叫抑制神经网络模型输出无啸叫的当前帧音频谱系数,或者抑制啸叫后的当前帧音频谱系数;其中,纯净音频谱系数及相应含啸叫音频谱系数包括,对纯净音频信号以及含啸叫音频信号进行蓝牙音频编码和/或解码时,经离散余弦变换步骤得到的音频谱系数。
[0006]本申请采用的另一个技术方案是:提供一种蓝牙设备,其包括编码器以及解码器,编码器和/或解码器设置有上述的蓝牙音频啸叫抑制装置。
[0007]本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算
机指令,该计算机指令被操作以执行第一种方案中的一种蓝牙音频啸叫抑制方法。
[0008]本申请的技术方案可以达到的有益效果是:提供一种蓝牙音频啸叫抑制方法、装置、介质及蓝牙设备,本申请通过利用编解码过程中的纯净音频谱系数及含啸叫音频谱系数训练神经网络模型,进一步利用训练好的申请网络模型在编解码过程中抑制啸叫,能够较好地对音频中的啸叫进行抑制,同时降低系统复杂度,减少运算量,降低系统延时,提升用户体验。
附图说明
[0009]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0010]图1是蓝牙音频啸叫发生过程示意图;图2是本申请一种蓝牙音频啸叫抑制方法的一个具体实施方式流程示意图;图3是本申请一种蓝牙音频啸叫抑制方法的一个具体实施例中对深度神经网络模型训练的示意图;图4是本申请一种蓝牙音频啸叫抑制装置的一个具体实施方式的示意图;通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0011]下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
[0012]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0013]为了检测以便于进一步避免啸叫,现有技术中,可以在音频处理的路径上插入一个模块,譬如在音频编码器之前或音频解码器之后插入,用来检测啸叫的产生进而避免啸叫。现有方案中现有技术在啸叫的抑制和检测过程中用到深度学习时,只能进行啸叫的检测或者抑制两者中的一者,还需要进行反复地时频转换或者利用其他的设备,例如进行线性调频z变换(记为czt)和傅里叶变换及其反变换(记为FFT和IFFT)算量很大,对系统要求很高,在通常基于嵌入式系统的处理器蓝牙音频设备上实施较为困难。
[0014]本申请通过利用编解码过程中的纯净音频谱系数及含啸叫音频谱系数训练神经网络模型,进一步利用训练好的申请网络模型在编解码过程中抑制啸叫,能够降低系统复
杂度,减少运算量,降低系统延时,提升用户体验。
[0015]下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
[0016]图2示出了本申请一种蓝牙音频啸叫抑制方法的一个具体实施方式。
[0017]在图2示出的本申请蓝牙音频啸叫检测抑制方法包括:过程S201,利用包括大量纯净音频谱系数及相应含啸叫音频谱系数的训练集,对神经网络模型进行离线训练得到啸叫抑制神经网络模型;过程S202,在蓝牙音频编码和/或解码过程中,利用经离散余弦变换得到的当前帧音频谱系数得到当前帧特征向量;以及,过程S203,将当前帧特征向量作为输入,利用啸叫抑制神经网络模型输出无啸叫的当前帧音频谱系数,或者抑制啸叫后的当前帧音频谱系数。其中纯净音频谱系数及相应含啸叫音频谱系数包括,对纯净音频信号以及含啸叫音频信号进行蓝牙音频编码和/或解码时,经离散余弦变换步骤得到的音频谱系数。
[0018]本申请通过利用编解码过程中的纯净音频谱系数及含啸叫音频谱系数训练神经网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种蓝牙音频啸叫抑制方法,其特征在于,包括,利用包括大量纯净音频谱系数及相应含啸叫音频谱系数的训练集,对神经网络模型进行离线训练得到啸叫抑制神经网络模型;在蓝牙音频编码和/或解码过程中,利用经离散余弦变换得到的当前帧音频谱系数得到当前帧特征向量;以及将所述当前帧特征向量作为输入,利用所述啸叫抑制神经网络模型输出无啸叫的当前帧音频谱系数,或者抑制啸叫后的当前帧音频谱系数;其中,所述纯净音频谱系数及相应含啸叫音频谱系数包括,对纯净音频信号以及含啸叫音频信号进行所述蓝牙音频编码和/或解码时,经所述离散余弦变换步骤得到的音频谱系数。2.根据权利要求1所述的蓝牙音频啸叫抑制方法,其特征在于,所述神经网络模型为深度神经网络模型;所述利用包括大量纯净音频谱系数及相应含啸叫音频谱系数的训练集,对神经网络模型进行离线训练的过程包括,将所述纯净音频谱系数与所述相应含啸叫音频谱系数输入所述神经网络模型;以所述纯净音频谱系数作为参考,将所述相应含啸叫音频谱系数利用所述神经网络模型经非线性处理后得到处理后音频谱系数;调整所述神经网络模型的隐藏层的权重和偏移使得所述处理后音频谱系数与所述纯净音频谱系数的均方误差最小时,冻结所述神经网络模型的隐藏层的权重和偏移。3.根据权利要求2所述的蓝牙音频啸叫抑制方法,其特征在于,所述调整所述神经网络模型的隐藏层的权重和偏移的过程包括,基于反向传播调节所述神经网络模型的隐藏层的权重和偏移。4.根据权利要求1所述的蓝牙音频啸叫抑制方法,其特征在于...

【专利技术属性】
技术研发人员:李强朱勇王尧叶东翔
申请(专利权)人:北京百瑞互联技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1