一种声学回声消除的方法和系统技术方案

技术编号:36270775 阅读:58 留言:0更新日期:2023-01-07 10:12
本发明专利技术涉及音频信号处理领域,目的是提供一种声学回声消除的方法和系统,其中方法包括获取近端音频信号(麦克风拾取到的带回声的音频信号)和远端音频信号(混合回声的音频信号),其中,根据所述近端音频信号和远端音频信号构建声学回声信号模型,根据音频信号的时频分布的稀疏性计算所述声学回声信号模型中接收端采集的有效音频信号,本发明专利技术通过基于音频时频分布稀疏性提出一种新的声学回声消除方法。法。法。

【技术实现步骤摘要】
一种声学回声消除的方法和系统


[0001]本专利技术涉及音频信号处理
,具体涉及一种声学回声消除的方法和系统。

技术介绍

[0002]在音频远程交互过程,凡是需要同时使用麦克风和扬声器的地方,就会不可避免的出现声学回声,声学回声的根源是远端的声音通过本地的扬声器播放出来又被近端的麦克风拾取到了,被近端麦克风拾取的声音在音频远程交互过程又传到远端,远端将讲话者就会听到自己的回声。
[0003]目前,自适应回声消除技术是国际公认的最有效的技术,但在实际研究中,我们发现有些问题采用通常的自适应滤波器方法很难克服。
[0004]首先,实际房间响应长度与自适应滤波器阶数之间的差异,即失配问题。实际当中因为无法事先知道房间响应长度,因此都必须选择一个足够大的滤波器阶数,除了计算复杂度升高问题,还有对房间响应变化的跟踪能力下降。
[0005]其次,回声路径中的非线性问题。由于实际产品统采用的扬声器、麦克风等电声器件以及功率部件品质差异,实际近端麦克风拾取的回声信号往往存在不同程度的非线性失真。这种自适应线性滤波器很难解决。

技术实现思路

[0006]本专利技术的目的在于克服现有技术的不足,基于音频时频分布稀疏性提出一种新的声学回声消除方法。
[0007]具体通过以下技术方案来实现的:一方面,一种声学回声消除的方法,包括近端音频采集端和远端音频播放端,获取近端音频信号和远端音频信号,其中,根据近端音频信号和远端音频信号构建声学回声信号模型,根据音频信号的时频分布稀疏性保留所述声学回声信号模型中近端采集端的有效音频信号。
[0008]进一步的,所述近端音频信号包括有效音频信号和回声信号,所述有效音频信号通过播放后再次被近端采集端捕获得到回声信号。
[0009]进一步的,所述远端音频信号包括初始回声信号,定义初始回声信号为远端信号。
[0010]进一步的,所述声学回声信号模型的搭建包括下列步骤:S1:基于有效音频信号和回声信号混叠得到近端音频信号,执行步骤S2;S2:对远端信号和麦克风采集的近端音频信号依次进行傅里叶变换,分别得到远端信号与近端音频信号的能量谱,执行步骤S3;S3:判断音频信号是否处于静音状态,若是静音状态,则结束;若是非静音状态,则进入S4;S4:对远端信号的能量谱用串联的回归模型构造混响谱,执行步骤S5;
S5:通过混响谱计算回声信号与远端信号之间的失真估计,执行步骤S6;S6:通过所述失真估计计算回声信号的过谱估计,执行步骤S7;S7:通过所述回声信号的过谱估计计算有效音频信号的过谱估计,执行步骤S8;S8:得到消除回声信号后的有效音频信号。
[0011]进一步的,所述步骤S1中,近端音频信号、有效音频信号、回声信号和远端信号均为时间和频率的二次函数,所述远端信号基于失真函数计算得到回声信号。
[0012]另一方面,在上述的基础上,还包括,音频采集模块,用于捕获环境中的所有音频信号;音频拆解模块,用于拆解所有音频信号,得到有效音频信号和回声信号;音频播放模块,用于播放除去回声信号后的有效音频信号。
[0013]进一步的,所述音频采集模块包括连续捕获环境中音频信号的接收设备,所述接收设备连接有播放设备并在环境中播放音频信号。
[0014]进一步的,所述音频拆解模块内预存训练完成的音声学回声信号模型,所述音声学回声信号模型的输入为所有音频信号,所述音声学回声信号模型的输出为有效音频信号。
[0015]进一步的,所述音频信号具体为连续性的时频信号,所述时频信号根据时频信号发射源的不同,得到对应的频率峰值和波段。
[0016]进一步的,通过对所述所有音频信号进行傅里叶变换消除所述所有音频信号中的回声信号。
[0017]本专利技术的有益效果是:1、克服了传统的自适应线性滤波器难以解决的问题,即近端麦克风拾取的回声信号的非线性失真;2、不局限环境的空间大小,均能够对采集的音频信号进行高效除噪。
附图说明
[0018]图 1为本专利技术的一个实施例的回声消除方法流程图;图 2为本专利技术的一个实施例中声学回声消除处理前后的示意图。
具体实施方式
[0019]下面结合本专利技术的附图1和附图2,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例均属于本申请的保护范围。
[0020]实施例:基于自适应滤波器的回声消除实际上是对近端房间的声学通路进行精确建模,进而产生一个抵消信号,因此一旦所建模型与实际不符或者不够精确,回声消除效果就会下
降。其实我们可以把回声消除看成一个近端讲话检测问题。电话呼叫或远程会议中,近端是您所在的位置,远端是呼叫中其他参与者所在的位置,此时近端扬声器发出的声音被看成是时变的噪声信号,近端音频是有用信号(有效音频信号),而近端麦克风拾取的信号就是含噪信号(近端音频信号)。远端信号实际上是噪声信号的一个非常有用的参考。因此问题就变成:在给定参考噪声(远端信号)条件下,从近端麦克风拾取的信号中检测是否有有效音频信号存在,而中包含的回声噪声信号是经过了某种失真,即失真函数的计算公式为,。
[0021]现在,我们并不精确地估计,转而观察几个信号的语谱图。设和各自的傅里叶变换分别为和,、是时间λ和频率k的二维函数,它将信号的时域和频域联系起来,我们可以据此对信号进行时频分析,根据音频信号的时频分布稀疏性特点可知,这两个不相关的音频信号混叠在一起构成信号时,语谱图中总存在某些点,语谱图的横坐标是时间,纵坐标是频率,坐标点值为语音数据能量,在这些点,而在另一些点上,,而且更重要的是,基于音频时频分布稀疏性我们还可以分别根据这些点,重建出信号和,分别包含和的大部分能量,或者说非常好的重建原信号,失真很小。以为例,重建方法如下
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)因此,假设我们能够得到的大致估计,则判断中是否有出现就可以简单由与的比较得出。因为,如果中没有,则必然,反之如果出现了,则必然有相当数量的时频点上。这样,我们可以通过统计这样时频点的数量来判定是否有近端讲话出现。
[0022]现在的问题是如何得到的大致估计。为了使上面的判定法则尽可能奏效,我们实际上应该找到的过估计,因为一旦估计偏小,当没有时,由于,故仍会有相当数量的时频点上。我们考虑参考噪声,根据回声抑制系统的情况可知,实际上是的混响结果再经过某些失真得到的,因此我们采用两个步骤来从中近似得到的大致估计,一个是模拟混响,另一个是估计失真。
[0023]首先根据混响原理,我们可以从得到粗略的混响谱,为了尽可能适应大的混响长度,我们用了两个串联的回归模型构造一个足够强的混响谱,即,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)采用与频率相关的回归系数a1和a2可以构造各种环境下的混响效果,为了简便起<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声学回声消除的方法,包括近端音频采集端和远端音频播放端,其特征在于,获取近端音频信号和远端音频信号,其中,根据近端音频信号和远端音频信号构建声学回声信号模型,根据音频信号的时频分布稀疏性保留所述声学回声信号模型中近端采集端的有效音频信号。2.根据权利要求1所述的一种声学回声消除的方法,其特征在于,所述近端音频信号包括有效音频信号和回声信号,所述有效音频信号通过播放后再次被近端采集端捕获得到回声信号。3.根据权利要求2所述的一种声学回声消除的方法,其特征在于,所述远端音频信号包括初始回声信号,定义初始回声信号为远端信号。4.根据权利要求3所述的一种声学回声消除的方法,其特征在于,所述声学回声信号模型的搭建包括下列步骤:S1:基于有效音频信号和回声信号混叠得到近端音频信号,执行步骤S2;S2:对远端信号和麦克风采集的近端音频信号依次进行傅里叶变换,分别得到远端信号与近端音频信号的能量谱,执行步骤S3;S3:判断音频信号是否处于静音状态,若是静音状态,则结束;若是非静音状态,则进入S4;S4:对远端信号的能量谱用串联的回归模型构造混响谱,执行步骤S5;S5:通过混响谱计算回声信号与远端信号之间的失真估计,执行步骤S6;S6:通过所述失真估计计算回声信号的过谱估计,执行步骤S7;S7:通过所述回声信号的过谱估计计算有效音频信号的过谱估计,执行步骤S8...

【专利技术属性】
技术研发人员:刘开文
申请(专利权)人:成都海普迪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1