一种多通道回声滤除方法、滤除装置和可读存储介质制造方法及图纸

技术编号:25809433 阅读:40 留言:0更新日期:2020-09-29 18:44
本发明专利技术提供一种多通道回声滤除方法、滤除装置和可读存储介质,通过第一音频数据和第二音频数据重采样,继而得出第一时域数据和第二时域数据,继而处理得出第一反转时域数据和第二反转时域数据,随后将MIDFT矩阵和DFT矩阵进行叠加并相乘,计算得出的第一重采样时域信号和第二重采样时域信号进行低频相位处理,最后对回声信号进行滤除,并输出回声滤除后的声音信号。通过重采样对多通路的去相关方法,使得基于重采样前后等效于延时处理,且通过重采样比值主观控制信号处理前后的相关性,并且基于延时累计问题可通过重采样比值的组合解决,并能通过信号反转解决处理块间不连续问题。

【技术实现步骤摘要】
一种多通道回声滤除方法、滤除装置和可读存储介质
本专利技术涉及回声滤除领域,特别是涉及一种多通道回声滤除方法、滤除装置和可读存储介质。
技术介绍
在语音通信或者人机交互的应用中,常常存在回声的干扰。而且随着人们对通话质量的要求不断提高,以及智能语音音箱的不断发展,回声消除算法(AcousticEchoCancellation,AEC)成为了当今的一个热点。例如,在智能语音音箱的人机交互应用中,需要在嘈杂的音乐环境下,通过AEC算法消除音乐的干扰,让机器可以准确获取唤醒词的准确信息,从而唤醒音箱进行下一步的交互。在智能语音音箱发展初期,大部分设备只限制于播放单通路音频,在此情况下,通过最小均方(LeastMeanSquare,LMS)能达到较理想的效果。然而随着立体声以及多通路音频在智能语音音箱中的实现,仅采用LMS算法会导致失调问题,尤其是当通路间的相关性较高时,失调尤其严重。因此,在LMS处理前,有学者提出对通路间进行去相关处理,以降低后期的失调问题。常用的去相关算法包括:加噪声、非线性、相位调整、基于听觉模型等等。图1图示了立体声回声消除处理系统。首先,在模块100中,立体声的左右通路102和103可以等效成远端房间的同一信号源101经过不一样的远端房间脉冲和所得,经过110模块进行去相关处理,得到处理后的左通路122和右通路123通过扬声器在近端房间进行播放,通过近端房间脉冲和后分别得到134和135与语音信号源131混合进入麦克风中。为了消除回声部分134和135,保留语音部分131,在120模块中采用LMS算法计算和,近似估计近端房间脉冲和,并分别与左通路122和右通路123相乘,得到左回声134的近似124,以及右回声135的近似125。因此得到的信号126仅保留了语音131。实际情况下,当不进行左右通路的去相关算法,或者去相关的程度不够,会出现以下两个问题:1)如公式1所示和不仅仅与近端房间脉冲和有关,同时也和远端房间脉冲和有关,导致解的不唯一性。2)产生失调问题,如式(2)所示,失调是指估计脉冲和真实房间脉冲之间的差异。当和的差异越大时,ε越大。推导所得,失调ε可近似为式(3),其中为左右通路间的互功率谱密度,为左通路122或者右通路123的自功率谱密度。从式中可以看出,当左通路122和右通路123相等时,即相关性为1,失调ε为∞;换句话说,当左通路122和右通路123相关性较高时,失调依然很大。
技术实现思路
本专利技术的第一目的是提供一种既能均衡通路间的去相关效果和主观感知,又能通过客观调整参数从而控制去相关的程度的一种多通道回声滤除方法。本专利技术的第二目的是提供一种既能均衡通路间的去相关效果和主观感知,又能通过客观调整参数从而控制去相关的程度的一种多通道回声滤除装置。本专利技术的第三目的是提供一种既能均衡通路间的去相关效果和主观感知,又能通过客观调整参数从而控制去相关的程度的可读存储介质。为了实现本专利技术的第一目的,本专利技术提供一种多通道回声滤除方法,包括:获取第一通道的第一音频数据和第二通道的第二音频数据,分别对第一音频数据和第二音频数据重采样,继而得出第一时域数据和第二时域数据;对第一时域数据和第二时域数据利用镜像原理处理得出第一反转时域数据和第二反转时域数据;根据重采样率和初始采样率的比值R大于1时,计算并得出第一MIDFT矩阵;根据重采样率和初始采样率的比值R小于1时,计算并得出第二MIDFT矩阵;计算DFT矩阵;将第一MIDFT矩阵和DFT矩阵进行叠加并相乘,继而得出将第一MIDFT矩阵和DFT矩阵进行叠加并相乘,继而得出根据第一时域数据和计算得出P1,根据第二时域数据和计算得出P2;P1相乘第一反转时域数据得出第一重采样时域信号;P2相乘第二反转时域数据得出第二重采样时域信号;对第一重采样时域信号和第二重采样时域信号进行低频相位处理;接收声音信号,声音信号包括语音信号和回声信号,根据经过低频相位处理后的第一重采样时域信号和第二重采样时域信号对回声信号进行滤除,并输出回声滤除后的声音信号。更进一步的方案是,第一时域数据为xl,2N=[xl[-N],....xl[0],....xl[N-1]]T,L为左声道的音频数据,N为一帧数据的长度,T为混响时间;第二时域数据为xr,2N=[xl[-N],....xl[0],....xl[N-1]]T,R为左声道的音频数据。更进一步的方案是,第一反转时域数据为第二反转时域数据为更进一步的方案是,MIDFT矩阵为:更进一步的方案是,DFT矩阵为:[F]k+1,n+1=e-j2πkn/4N,k,n∈[0,4N-1]。更进一步的方案是,对第一重采样时域信号和第二重采样时域信号进行低频相位处理的步骤包括:对经过低频相位处理后的第一重采样时域信号和第二重采样时域信号进行FFT转换,并得出第一频域信号和第二频域信号;对第一频域信号和第二频域信号分别提取第一相位值和第二相位值,通过第一相位值减去第二相位值得出相位差值;根据相位差值,对第一相位值和第二相位值进行相位调整;根据相位调整后的第一相位值将第一频域信号时频逆转换,得出第一输出时域信号;根据相位调整后的第二相位值将第二频域信号时频逆转换,得出第二输出时域信号;根据第一输出时域信号和第二输出时域信号进行滤除,并输出回声滤除后的声音信号。为了实现本专利技术的第二目的,本专利技术提供一种多通道回声滤除装置,包括处理器,处理器用于执行存储器中存储的计算机程序时实现如上述方案的滤除方法的步骤。为了实现本专利技术的第三目的,本专利技术提供一种可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述方案的滤除方法的步骤。由上述方案可见,通过重采样对多通路的去相关方法,使得基于重采样前后等效于延时处理,且通过重采样比值主观控制信号处理前后的相关性,并且基于延时累计问题可通过重采样比值的组合解决,并能通过信号反转解决处理块间不连续问题,另外基于时域或者频域处理有较好的去相关效果,且主观听感不受去相关作用的影响。最后利用基于低频的相位调整,能进一步降低通路间的相关性,故本方案既能均衡通路间的去相关效果和主观感知,又能通过客观调整参数从而控制去相关的程度。附图说明图1是立体声回声消除系统模块框图。图2是数据重采样所致各点延时的示意图。图3是对立体声延时处理的示意图。图4是本专利技术多通道回声滤除方法实施例的重采样去相关的流程图。图5是本专利技术多通道回声滤除方法实施例低频相位去相关的流程图。以下结合附图及实施例对本专利技术作进一步说明。具体实施方式参照图2,图2图示了对一帧数据进行重采样后,导致帧内各点延时示意图。设音频初始的采样率为fs,重采样后采样率为f本文档来自技高网
...

【技术保护点】
1.一种多通道回声滤除方法,其特征在于,包括:/n获取第一通道的第一音频数据和第二通道的第二音频数据,分别对所述第一音频数据和所述第二音频数据重采样,继而得出第一时域数据和第二时域数据;/n对所述第一时域数据和所述第二时域数据利用镜像原理处理得出第一反转时域数据和第二反转时域数据;/n根据重采样率和初始采样率的比值R大于1时,计算并得出第一MIDFT矩阵;/n根据重采样率和初始采样率的比值R小于1时,计算并得出第二MIDFT矩阵;/n计算DFT矩阵;/n将所述第一MIDFT矩阵和所述DFT矩阵进行叠加并相乘,继而得出

【技术特征摘要】
1.一种多通道回声滤除方法,其特征在于,包括:
获取第一通道的第一音频数据和第二通道的第二音频数据,分别对所述第一音频数据和所述第二音频数据重采样,继而得出第一时域数据和第二时域数据;
对所述第一时域数据和所述第二时域数据利用镜像原理处理得出第一反转时域数据和第二反转时域数据;
根据重采样率和初始采样率的比值R大于1时,计算并得出第一MIDFT矩阵;
根据重采样率和初始采样率的比值R小于1时,计算并得出第二MIDFT矩阵;
计算DFT矩阵;
将所述第一MIDFT矩阵和所述DFT矩阵进行叠加并相乘,继而得出
将所述第一MIDFT矩阵和所述DFT矩阵进行叠加并相乘,继而得出
根据所述第一时域数据和计算得出P1,根据所述第二时域数据和计算得出P2;
P1相乘所述第一反转时域数据得出第一重采样时域信号;
P2相乘所述第二反转时域数据得出第二重采样时域信号;
对所述第一重采样时域信号和所述第二重采样时域信号进行低频相位处理;
接收声音信号,所述声音信号包括语音信号和回声信号,根据经过低频相位处理后的第一重采样时域信号和第二重采样时域信号对所述回声信号进行滤除,并输出回声滤除后的声音信号。


2.根据权利要求1所述的回声滤除方法,其特征在于:
所述第一时域数据为xl,2N=[xl[-N],....xl[0],....xl[N-1]]T,L为左声道的音频数据,N为一帧数据的长度,T为混响时间;
所述第二时域数据为xr,2N=[xl[-N],....xl[0],....xl[N-1]]T,R为左声道的音频数据。


3.根据权利...

【专利技术属性】
技术研发人员:荣赶丁何颖洋
申请(专利权)人:珠海全志科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1