一种联合去混响的回声消除方法及装置制造方法及图纸

技术编号:30105217 阅读:16 留言:0更新日期:2021-09-18 09:13
一种联合去混响的回声消除方法,包括如下步骤:S1.利用麦克风阵列和音频播放装置分别获取模拟麦克风信号和模拟参考信号,通过ADC分别转化为数字麦克风信号和数字参考信号;S2.通过短时傅里叶变换将接收的数字麦克风信号和数字参考信号每个声道的时域信号分解成多个频点的频域信号,得到频域麦克风信号和频域参考信号;S3.将当前帧和当前帧的若干过去帧的频域麦克风信号和频域参考信号作为缓存的频域信号存储到联合预测缓存器中;S4.通过自适应滤波器对联合预测缓存器中缓存的频域信号进行滤波,并对其中的频域麦克风信号进行回声消除。本发明专利技术方案利用联合去混响的回声消除算法,可有效改善回声消除效果,提升语音交互质量。互质量。互质量。

【技术实现步骤摘要】
一种联合去混响的回声消除方法及装置


[0001]本专利技术属于语音识别
,具体涉及一种联合去混响的回声消除方法及装置。

技术介绍

[0002]近年来,人工智能技术和物联网在飞速发展落地,语音识别作为人机交互的重要手段,在其中具有关键性的作用,然而在实际落地过程中,复杂的声学应用环境中、严苛的用户体验限制着产品的有效落地推广,尤其针对具有扬声器和麦克风的音频系统,回声消除质量直接影响着用户语音识别交互体验。因此如何有效提升回声消除效果,是提升语音识别交互质量的关键问题。
[0003]目前常用的回声消除方法通过不同的自适应滤波器对回声通道进行估计,进而消除回声,该类方法具有一定的有效性,但忽略了环境中存在的混响,实际应用过程中往往会影响自适应滤波器的估计效果。同时还有另一类基于深度神经网络的回声消除方法,该类方法对解决回声消除过程中存在的非线性失真的问题上具有明显效果,但该类方法所需的训练样本比较苛刻,其实际落地的过程中,产品的算力、内存等因素制约了其发展。

技术实现思路

[0004]为克服现有回升消除方法存在的技术缺陷,本专利技术公开了一种联合去混响的回声消除方法及装置。
[0005]本专利技术所述联合去混响的回声消除方法,包括如下步骤:S1.利用麦克风阵列和音频播放装置分别获取模拟麦克风信号和模拟参考信号,通过ADC分别转化为数字麦克风信号和数字参考信号;S2. 通过短时傅里叶变换将接收的数字麦克风信号和数字参考信号每个声道的时域信号分解成多个频点的频域信号,得到频域麦克风信号和频域参考信号;S3.逐帧进行下列操作:将当前帧和当前帧的若干过去帧的频域麦克风信号和频域参考信号作为缓存的频域信号存储到联合预测缓存器中;S4.通过自适应滤波器对联合预测缓存器中缓存的频域信号进行滤波,并对其中的频域麦克风信号进行回声消除;滤波采用的联合预测自适应滤波器W(l,k)=P(l,k)*
ꢀꢀꢀ
R(l,k);P(l,k)为第l帧第k个频点的频域转置信号Buff_T(l,k)的自相关矩阵逆矩阵;R(l,k)为第l帧第k个频点的频域麦克风信号Mic(l,k)与缓存的频域信号Buff(l,k)的互相关矩阵;输出目标语音频域信号Y:第l帧第k个频点的目标语音频域信号Y(l,k)= Mic(l,k)

W
H
(l,k)* Buff_T(l,k);
其中上标H表示共轭转置,Mic(l,k)为第l帧第k个频点的频域麦克风信号。
[0006]优选的,所述S4步骤中的R(l,k)= λR(l

1,k)+(1

λ) Buff_T(l,k)conj(Mic(l,k));λ为遗忘因子,R(l

1,k) 为第l

1帧第k个频点的频域麦克风信号Mic(l

1,k)与缓存的频域信号Buff(l

1,k)的互相关矩阵;Buff_T(l,k)为第l帧第k个频点的频域转置信号;conj表示共轭。
[0007]优选的,所述S4步骤中的P(l,k)计算方式如下:骤中的P(l,k)计算方式如下:;λ为遗忘因子,P(l

1,k)表示第l

1帧第k个频点的频域转置信号Buff_T(l

1,k)的自相关矩阵逆矩阵,P(l,k)定义以此类推; Buff_T(l,k)为第l帧第k个频点的频域转置信号,上标H表示共轭转置;Kal(l,k)为第l帧第k个频点Kalman增益矩阵。
[0008]优选的,所述S3步骤中,将当前帧和当前帧的(L
P

1)帧的频域麦克风信号和(V

1)帧频域参考信号作为缓存的频域信号存储到联合预测缓存器中;其中为L
P
参考信号线性预测长度,V为麦克风信号线性预测长度。
[0009]本专利技术还公开了一种联合去混响的回声消除装置,包括联合预测缓存器及与其连接的两条预处理支路,所述预处理支路包括串联的模数转换器和短时傅里叶变换模块;所述联合预测缓存器还连接有转置模块,所述转置模块还连接有联合预测自适应滤波器,所述两条预处理支路中用于与麦克风连接的支路的短时傅里叶变换模块与回声消除器和所述联合预测自适应滤波器连接;所述联合预测自适应滤波器还连接有共轭装置模块;所述共轭装置模块和转置模块共同连接有乘法器,所述乘法器连接所述回声消除器,所述回声消除器还连接有一个短时傅里叶变换模块本专利技术方案利用联合去混响的回声消除算法,可有效改善回声消除效果,提升语音交互质量。
附图说明
[0010]图1为本专利技术所述回声消除方法的一个具体流程示意图;图2为本专利技术所述回声消除装置的一个具体实施方式示意图;图3为本专利技术一个具体实施例中的输入信号波形示意图;图4为采用现有技术和本专利技术所述方法对图3中的输入信号进行回波消除后的输出信号波形对比示意图;图3和图4中波形图横坐标均为时间,纵坐标均为电压。
具体实施方式
[0011]下面对本专利技术的具体实施方式作进一步的详细说明。
[0012]本专利技术所述本专利技术所述回声消除方法可以包括以下步骤实现:S1.利用麦克风阵列和音频播放装置分别获取模拟麦克风信号和模拟参考信号,通过ADC(模拟数字转换器)分别转化为数字麦克风信号和数字参考信号。
[0013]麦克风阵列中的麦克风个数N不小于2,当N=1时为单麦克风系统;多个麦克风形成的阵列结构不局限于规则几何形状阵列或非常规阵列,音频播放装置中的扬声器个数Q不小于1,参考信号通道数体现在声源属性上,如立体声音源存在两路通道,则其产生的参考通道是有两路音源信号;而在对音质要求没有严苛要求时或传输带宽有限时,往往音源只需取一路信号或只有一路信号。
[0014]为对具体实施方式作进一步的详细说明,以最小系统为例,即采用单麦克风单扬声器系统进行介绍,此时N=1,Q=1。
[0015]模拟麦克风信号从麦克风阵列的电学信号输出端获取,模拟参考信号为音频播放装置输入的电学模拟信号。
[0016]如图2所示,音频源发出的模拟参考信号通过喇叭转化为音频信号播放,播放后的音频信号混杂外部环境噪音等其他音频信号后被麦克风接收并转化为作为模拟麦克风信号的电学信号。
[0017]S2. 通过短时傅里叶变换将接收的数字麦克风信号和数字参考信号每个声道的时域信号分解成K1个频点的频域信号,一个具体实施方式中,在短时傅里叶的过程中,采用512点的傅里叶变换,此时频点数K1=257。
[0018]即将数字麦克风信号中当前第l帧的时域麦克风信号转换成频域麦克风信号Mic(l)=[ Mic1(l), Mic2(l)

Mic
N
(l)],在示例的最小系统中,Mic(l)的维度为K1*1;N为麦克风个数;将数字参考信号中的时域参考信号转换成频域参考信号;Ref(l)=[ Ref1(l), Ref2(l)
...

【技术保护点】

【技术特征摘要】
1.一种联合去混响的回声消除方法,其特征在于,包括如下步骤:S1.利用麦克风阵列和音频播放装置分别获取模拟麦克风信号和模拟参考信号,通过ADC分别转化为数字麦克风信号和数字参考信号;S2. 通过短时傅里叶变换将接收的数字麦克风信号和数字参考信号每个声道的时域信号分解成多个频点的频域信号,得到频域麦克风信号和频域参考信号;S3.逐帧进行下列操作:将当前帧和当前帧的若干过去帧的频域麦克风信号和频域参考信号作为缓存的频域信号存储到联合预测缓存器中;S4.通过自适应滤波器对联合预测缓存器中缓存的频域信号进行滤波,并对其中的频域麦克风信号进行回声消除;滤波采用的联合预测自适应滤波器W(l,k)=P(l,k)* R(l,k);P(l,k)为第l帧第k个频点的频域转置信号Buff_T(l,k)的自相关矩阵逆矩阵;R(l,k)为第l帧第k个频点的频域麦克风信号Mic(l,k)与缓存的频域信号Buff(l,k)的互相关矩阵;输出目标语音频域信号Y:第l帧第k个频点的目标语音频域信号Y(l,k)= Mic(l,k)

W
H
(l,k)* Buff_T(l,k);其中上标H表示共轭转置,Mic(l,k)为第l帧第k个频点的频域麦克风信号。2.如权利要求1所述联合去混响的回声消除方法,其特征在于,所述S4步骤中的R(l,k)= λR(l

1,k)+(1

λ) Buff_T(l,k)conj(Mic(l,k));λ为遗忘因子,R(l

1,k) 为第l

1帧第k个频点的频域麦克风信号Mic(l

1,k)与缓存...

【专利技术属性】
技术研发人员:刘文通曾帆胡岸万东琴
申请(专利权)人:成都启英泰伦科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1