回声消除器和用于回声消除器的方法技术

技术编号:24335254 阅读:59 留言:0更新日期:2020-05-29 22:02
本发明专利技术涉及一种计算机实现的用于更新回声消除器的至少一个频域滤波器系数W

Echo canceller and method for echo canceller

【技术实现步骤摘要】
【国外来华专利技术】回声消除器和用于回声消除器的方法
本专利技术涉及一种计算机实现的用于更新回声消除器的至少一个频域滤波器系数的方法,所述回声消除器具有至少一个通道并且每通道至少一个段,所述回声消除器的滤波器系数在频域中在时间区块处是可更新的。本专利技术还涉及一种回声消除器,所述回声消除器配置为执行所述方法。
技术介绍
声学回声是在诸如视频会议、车载话音通信、话音接口和人机对话系统之类的音频通信中存在的主要障碍。当来自连接于终端的多个扬声器的声音被连接于该终端的麦克风捕捉时,多通道声学回声(参见“声学多通道回声消除”,EP2438766B1以及“Advancesindigitalspeechtransmission”,Wiley,2008(“数字语音传输中的进展”,威利,2008))就显现了。终端可以是指台式计算机或移动电话、平板电脑、话音命令助手、专用音频会议设备、免提汽车电话等。因为所述终端通常放在房间内,房间墙壁处的多重声音反射以不同时间瞬时和强度到达麦克风,因此产生了大量的声学回声。所述回声“指纹”的特性对麦克风和(多个)扬声器的位置、房间几何结构和在其中存在的物体和人是敏感的。回声在通信中具有消极影响,因为视频会议中的参与者在他们说话时听到他们回响的话音,语音接口被他们的扬声器系统播放的声音(诸如音乐)“淹没”,并且给汽车驾驶员打移动电话的人听到回响在汽车车室内的他们自己的话音。虽然单声道(mono)系统仍代表大量的上述终端,但多通道音频系统正在越来越多地出现:汽车声音系统至少是立体声的,专用视频会议设备可以使用若干扬声器用于不同参会者,因此产生了更真实的开会体验,并且嵌入的话音接口共同集成在立体声设备之内。本专利技术聚焦了图1所示出的问题场景,其中例如多个音频通道的多个音频源10,由房间中的多个扬声器20播放,并且房间中的所有声音只被一个麦克风30捕捉。因为本专利技术能够单独地应用在每个麦克风信号上,所以其扩展到多于一个的麦克风(例如用于传输立体声)被认为是直截了当的。从此以后,“有效”扬声器是指所有再现相同音频源或其被线性滤波的版本的所有电声装置。例如,如果立体声的声音再现系统播放单通道(单声道)音频源,则有效扬声器的数量是一个。另一个例子是汽车立体声系统,所述汽车立体声系统可以看作若干(多于两个)物理的扬声器,但如果汽车声音系统例如正在再现立体声音乐,则有效扬声器例如音频通道的数量是两个。一经模拟到数字转换,由麦克风30捕捉的信号z(n)就能够被表达为下式:其中,n是离散时间,C是远端音频通道的数量,si(n)是第i通道处的远端音频源,hi(l)是第i个有效扬声器和麦克风之间的等效离散时间的回声路径,LH是所述回声路径的多个取样中的总长度,d(n)是主要(或期望)近端声音信号,并且v(n)是近端背景噪声。最后的项p(n)指的是诸如由于(多个)扬声器的非线性特性而导致的在(1)中的线性回声模型的偏差。主要近端信号d(n)可以由房间内的若干源产生。通常d(n)是向远端听者的具有语义值的语音、音乐或两者等等,因此要在最小失真情况下传输它。另一方面,假设为接近固定的近端背景噪声v(n)携带近端声学情景的相关情境信息。任何回声降低系统的目的是三重的:1.将麦克风信号z(n)中的回声分量降低到它们变得听不见的程度;2.尽可能多地保留麦克风信号z(n)中存在的主要近端信号d(n)的质量,以及3.维持麦克风信号z(n)中存在的近端背景噪声v(n)的感知印象。均由回声控制设备管理的声学回声消除器(AEC)、残余回声非线性处理器(NLP)和舒适噪声注入器(CNI)意图分别执行所述的三重目的。在下文中,回声降低系统的技术背景的简短概观通过参考图1和2来给出。基本的多通道和多段声学回声消除器200包括多个数字线性横向滤波器210,使得涉及第i通道的响应被建立为:其中S是每通道的段的数量,L是每个段的滤波器长度,wi,j(l)对应第i通道和第j段的滤波器系数,并且xi,j(n)是对滤波器wi,j(l)的输入信号,定义为:xi,j(n)=si(n-jL).(3)来自第i通道中所有S个段的滤波器的串接建立了用于所述第i通道的回声消除器的脉冲响应。合成的回声模型(2)意图传递与z(n)中的跟第i通道相关的回声类似的信号。如下通过来自所有C个通道的贡献相加,在220中建立总的消除器输出:产生了被降低了回声内容的输出e(n)。选择滤波器长度L的标准即,要包围远端信号si(n)的巨大的准静止间隔。例如,在几十毫秒内发现大部分语音音素,但是在更长的范围中,语音通常包含至少两个不同波谱特性的音素。用于汽车空间的具有40毫秒量级的回声路径长度的基于立体声语音的回声控制可以如下设计:回声消除器会具有两个通道,即C=2,并且每通道至少两个段,例如S≥2,其中滤波器长度L等效于价值20毫秒的信号取样,因此四个横向滤波器C×S=2×2=4。对于每个滤波器具有不同长度也可以是可能的。因为L通常是大数,所以时域卷积(2)产生了代价高的运算。作为其替代方案,消除器的响应能够在频域中利用N点区块来高效计算,使得N被选择为2的次方,以用于更好的计算效率。获得如下所述频域的基于块的卷积:其中,F是N点离散傅里叶变换(DFT)矩阵(因此F-1对应于离散傅里叶逆变换),并且运算符表示逐元素相乘。分别指第i通道和第j段的频域权重和远端输入块的N点列向量Wi,j和Xi,j被建立如下:Xi,j=F[xi,j(n-N+1)…xi,j(n-1)xi,j(n)]T,(7)其中,T表示转置。运算(5)刚好提供了线性卷积的M=N-L+1个有效取样,所述取样位于向量u的最后M个最右边元素。通过麦克风信号和按照(4)的整个消除器响应之间的差得到的M个有效误差,被存储在向量e中用于进一步处理:e=[e(n-M+1)…e(n)]T.(8)为了获得更接近麦克风信号z(n)中的实际回声的消除器响应(5),第i通道和第j段的频域权重Wi,j经由快速LMS算法(参见《声学回声装置和方法》,US2006/0018460A1)而更新如下:其中,包含被更新的权重,E是消除器输出e的频域对应项,由以下获得:运算符*表示复共轭,向量运算符/表示逐元素相除,|Xi,j|2是通过向量Xi,j中每个复数值的元素的平方大小建立的向量,ε>0防止了被零或接近零的值除,并且μ是步长。因为新的权重向量的时域对应项应当在其最右侧中包含多个零(6),所以能够通过将所述权重返回时域、将最后的N-L个抽头重置(为零)并且将结果返回到频域来进一步更新新的波谱权重(9)。所述时间约束的运算要求两个附加的DFT运算,从而提高了计算复杂性。如果需要,这一步可以以更缓慢的收敛为代价来避免(参见“Unconstrainedfrequency-domainadaptivefilter,”IEEETransactions本文档来自技高网...

【技术保护点】
1.计算机实现的用于更新回声消除器(50)的至少一个频域滤波器系数W

【技术特征摘要】
【国外来华专利技术】1.计算机实现的用于更新回声消除器(50)的至少一个频域滤波器系数Wi,j(k)的方法,所述回声消除器具有至少一个通道并且每通道至少一个段,所述回声消除器(50)的滤波器系数在频域中在时间区块m处可更新,所述方法包括:
将在第m时间区块期间的消除器输出Em(k)确定为Zm(k)和基于下式的消除项之间的差:



将在第m-l时间区块期间的消除器误差ε(k)确定为Zm-l(k)和基于下式的消除项之间的差:



将向后看误差确定为:



其中,是基于:



将向前看误差确定为:



其中,是基于:



根据第m时间区块期间的所述消除器输出Em(k)、根据第m-l时间区块期间的所述消除器误差ε(k)、根据所述向后看误差以及根据所述向前看误差确定最佳更新步长μi,j,m(k);以及
通过使用所述最佳更新步长μi,j,m(k)来更新所述至少一个滤波器系数Wi,j(k);
其中,
C对应于所述回声消除器(50)的通道i的数量i=0,……,C-1;
S对应于所述回声消除器(50)的每通道的段j数量j=0,……,S-1;
l是与零不同的整数;
k表示频率窗口标引;
∈是正值;
Zm(k)对应于所述麦克风信号在第m时间区块处的第k波谱窗口;
Zm-l(k)对应于所述麦克风信号在第m-l时间区块处的第k波谱窗口;
Xi,j,m(k)对应于所述远端信号在第i通道、第j段和第m时间区块处的第k波谱窗口;
Xi,j,m-l(k)对应于所述远端信号在第i通道、第j段和第m-l时间区块处的第k波谱窗口;
λ是所述超调因子;以及
a,b分别是通道和段标引。


2.根据权利要求1的方法,其中所述最佳步长μi,j,m(k)要么通过:



要么通过:



来计算,
其中,Ψm(k)是不可消除分量第m时间区块处的功率谱,并且Φi,j(k)是每个第i,j滤波器的失调的功率谱,其中,Ψm(k)和Φi,j(k)通过求解以下线性方程组来确定:












上述线性方程组受到不等式约束:
γ(k)>0,Ψm(k)>0,Φ0,0(k)>0,…,ΦC-1,S-1(k)>0;
其中,

对应于远端信号在第i通道、第j段和第m时间区块处的第k功率谱窗口,其中所述信号区块优选是加窗的;

对应于远端信号在第i通道、第j段和第m-l时间区块处的第k功率谱窗口,其中所述信号区块优选是加窗的;
Υ(k)对应于不可消除分量在第m-l时间区块处的第k功率谱窗口;

是归一化的向后看更新,计算为:



以及,

是归一化的向前看更新,计算为:





3.根据权利要求1的方法,其中所述通道的数量和所述每通道段的数量中的至少一个大于一;并且
根据在第m时间区块期间的所述消除器输出Em(k)、根据第m-l时间区块期间的所述消除器误差ε(k)、根据所述向后看误差根据所述向前看误差以及对于至少一个第r,s滤波器,根据至少一个附加向后看误差和根据至少一个附加向前看误差,来确定所述最佳步长μi,j,m,r和s分别是通道和段的标引,其中



其中是基于







其中是基于





4.根据权利要求2和3的方法,其中通过用所述至少一个第r,s滤波器的如下附加线性方程求解所述线性方程组,来确定所述不可消除分量的功率谱Ψm(k)和每个第i,j滤波器的失调的功率谱Φi,j(k),






上述附加线性方程受不等式约束:
γ(k)>0,Ψm(k)>0,Φ0,0(k)>0,…,ΦC-1,S-1(k)>0;
其中,

是不包括所述第r,s滤波器的归一化的向后看更新,计算为:



并且

是不包括所述第r,s滤波器的归一化的向前看更新,计算为:





5.根据权利要求1至4的任一项的方法,其中所述超调因子λ在1<λ≤2的范围中,并且优选等于2。


6.根据权利要求1至5的任一项的方法,其特征在于,通过下式确定由于滤波器失调导致的残余回声在第m区块处的功率谱



并且之后,基于所述消除器输出Em(k)和基于所确定的由于滤波器失调导致的残余回声的功率谱来确定改进的消除器输出Om(k)。


7.根据权利要求1至6的任一项的方法,其特征在于,通过累加法确定超过消除器的时间范围的回声在第m区块处的功率谱
其中,0<γ<1,
并且之后,基于所述消除器输出Em(k)和基于所确定的超过消除器的时间范围的回声的功率谱来确定改进的消除器输...

【专利技术属性】
技术研发人员:路易斯·韦鲁阿加
申请(专利权)人:主动音频有限公司
类型:发明
国别省市:奥地利;AT

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1