音频信号处理方法及装置制造方法及图纸

技术编号:32290707 阅读:67 留言:0更新日期:2022-02-12 19:59
本公开关于一种音频信号处理方法及装置,音频信号处理方法包括:获取近端采集音频信号、远端参考音频信号,以及对近端采集音频信号进行线性回声消除后得到的第一近端音频信号;对近端采集音频信号、远端参考音频信号和第一近端音频信号分别进行时频变换,得到频域近端采集音频信号、频域远端参考音频信号和第一频域近端音频信号;对第一频域近端音频信号的幅度进行深度学习降噪,得到第二频域近端音频信号;基于频域远端参考音频信号、频域近端采集音频信号、第一频域近端音频信号和第二频域近端音频信号,对第二频域近端音频信号进行非线性回声消除,得到频域近端音频增强信号;对频域近端音频增强信号进行时频逆变换,得到近端音频增强信号。近端音频增强信号。近端音频增强信号。

【技术实现步骤摘要】
音频信号处理方法及装置


[0001]本公开涉及信号处理
,更具体地说,涉及一种音频信号处理方法及装置。

技术介绍

[0002]回声消除(Acoustic Echo Cancellation,AEC)是实时通讯中的重要技术之一,是保证音视频体验的关键点。回声消除技术是指将近端麦克风采集到的音频信号中的远端信号消除掉,只保留下近端信号,其中,近端麦克风采集到的音频信号包括近端信号及远端信号通过近端扬声器播放出来的信号。回声消除技术一般包括线性回声消除和非线性回声消除。
[0003]相关技术中,一般将回声消除和传统降噪如滤波进行结合,从而达到降噪和回声消除的效果,但是这种方法处理得到的音频信号存在回声消除和降噪效果较差,且音质不佳的问题。

技术实现思路

[0004]本公开提供一种音频信号处理方法及装置,以至少解决上述相关技术中的问题,也可不解决任何上述问题。
[0005]根据本公开实施例的第一方面,提供一种音频信号处理方法,包括:获取近端采集音频信号、远端参考音频信号,以及对所述近端采集音频信号进行线性回声消除后得到的第一近端音频信号;对所述近端采集音频信号、所述远端参考音频信号和所述第一近端音频信号分别进行时频变换,得到频域近端采集音频信号、频域远端参考音频信号和第一频域近端音频信号;对所述第一频域近端音频信号的幅度进行深度学习降噪,得到第二频域近端音频信号;基于所述频域远端参考音频信号、所述频域近端采集音频信号、所述第一频域近端音频信号和所述第二频域近端音频信号,对所述第二频域近端音频信号进行非线性回声消除,得到频域近端音频增强信号;对所述频域近端音频增强信号进行时频逆变换,得到近端音频增强信号。
[0006]可选地,所述对所述第一频域近端音频信号的幅度进行深度学习降噪,得到第二频域近端音频信号,包括:通过训练好的降噪神经网络模型,对所述第一频域近端音频信号的幅度进行深度学习降噪,得到所述第二频域近端音频信号的幅度;根据所述第二频域近端音频信号的幅度和所述第一频域近端音频信号的相位,得到所述第二频域近端音频信号。
[0007]可选地,所述通过训练好的降噪神经网络模型,对所述第一频域近端音频信号的幅度进行深度学习降噪,得到所述第二频域近端音频信号的幅度,包括:将所述第一频域近端音频信号的幅度输入所述训练好的降噪神经网络模型中,得到第一信号幅度比,其中,所述第一信号幅度比为所述第二频域近端音频信号的幅度和所述第一频域近端音频信号的幅度的比值的预测值;根据所述第一信号幅度比和所述第一频域近端音频信号的幅度,得到所述第二频域近端音频信号的幅度,其中,所述第二频域近端音频信号的幅度是所述第
一信号幅度比和所述第一频域近端音频信号的幅度的乘积。
[0008]可选地,所述基于所述频域远端参考音频信号、所述频域近端采集音频信号、所述第一频域近端音频信号和所述第二频域近端音频信号,对所述第二频域近端音频信号进行非线性回声消除,得到频域近端音频增强信号,包括:将所述频域远端参考音频信号分别与所述频域近端采集音频信号和第二频率近端音频信号在各个频带上进行求相关,得到各个频带的第二信号幅度比;根据所述第二信号幅度比、所述第一频域近端音频信号和所述第二频域近端音频信号,对所述第二频域近端音频信号进行非线性回声消除,得到频域近端音频增强信号。
[0009]可选地,所述根据所述第二信号幅度比、所述第一频域近端音频信号和所述第二频域近端音频信号,对所述第二频域近端音频信号进行非线性回声消除,得到频域近端音频增强信号,包括:获取所述第二信号幅度比和所述第一频域近端音频信号的幅度的乘积作为参考幅度;获取所述参考幅度和所述第二频域近端音频信号的幅度中的最小值,作为所述频域近端音频增强信号的幅度;根据所述频域近端音频增强信号的幅度和所述第一频域近端音频信号的相位,得到频域近端音频增强信号。
[0010]可选地,所述第二信号幅度比通过下式获取:
[0011]Mask(n,k)=min{1

RCr(n,k),1

RY
p
r(n,k)};
[0012]其中,Mask(n,k)为所述第二信号幅度比,RCr(n,k)为所述频域远端参考音频信号和所述频域近端采集音频信号的互相关系数,RY
p
r(n,k)为所述频域远端参考音频信号和所述第二频域近端音频信号的互相关系数,n为帧序列数,k为中心频率序列数,0<n≤N,0<k≤K,N为总帧数,K为总频带数。
[0013]根据本公开实施例的第二方面,提供一种音频信号处理装置,包括:信号获取单元,被配置为:获取近端采集音频信号、远端参考音频信号,以及对所述近端采集音频信号进行线性回声消除后得到的第一近端音频信号;频域变换单元,被配置为:对所述近端采集音频信号、所述远端参考音频信号和所述第一近端音频信号分别进行时频变换,得到频域近端采集音频信号、频域远端参考音频信号和第一频域近端音频信号;深度降噪单元,被配置为:对所述第一频域近端音频信号的幅度进行深度学习降噪,得到第二频域近端音频信号;非线性消除单元,被配置为:基于所述频域远端参考音频信号、所述频域近端采集音频信号、所述第一频域近端音频信号和所述第二频域近端音频信号,对所述第二频域近端音频信号进行非线性回声消除,得到频域近端音频增强信号;时域变换单元,被配置为:对所述频域近端音频增强信号进行时频逆变换,得到近端音频增强信号。
[0014]可选地,深度降噪单元被配置为:通过训练好的降噪神经网络模型,对所述第一频域近端音频信号的幅度进行深度学习降噪,得到所述第二频域近端音频信号的幅度;根据所述第二频域近端音频信号的幅度和所述第一频域近端音频信号的相位,得到所述第二频域近端音频信号。
[0015]可选地,深度降噪单元被配置为:将所述第一频域近端音频信号的幅度输入所述训练好的降噪神经网络模型中,得到第一信号幅度比,其中,所述第一信号幅度比为所述第二频域近端音频信号的幅度和所述第一频域近端音频信号的幅度的比值的预测值;根据所述第一信号幅度比和所述第一频域近端音频信号的幅度,得到所述第二频域近端音频信号的幅度,其中,所述第二频域近端音频信号的幅度是所述第一信号幅度比和所述第一频域
近端音频信号的幅度的乘积。
[0016]可选地,非线性消除单元被配置为:将所述频域远端参考音频信号分别与所述频域近端采集音频信号和第二频率近端音频信号在各个频带上进行求相关,得到各个频带的第二信号幅度比;根据所述第二信号幅度比、所述第一频域近端音频信号和所述第二频域近端音频信号,对所述第二频域近端音频信号进行非线性回声消除,得到频域近端音频增强信号。
[0017]可选地,非线性消除单元被配置为:获取所述第二信号幅度比和所述第一频域近端音频信号的幅度的乘积作为参考幅度;获取所述参考幅度和所述第二频域近端音频信号的幅度中的最小值,作为所述频域近端音频增强信号的幅度;根据所述频域近端音频增强信号的幅度和所述第一频域近端音频信号的相位本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频信号处理方法,其特征在于,包括:获取近端采集音频信号、远端参考音频信号,以及对所述近端采集音频信号进行线性回声消除后得到的第一近端音频信号;对所述近端采集音频信号、所述远端参考音频信号和所述第一近端音频信号分别进行时频变换,得到频域近端采集音频信号、频域远端参考音频信号和第一频域近端音频信号;对所述第一频域近端音频信号的幅度进行深度学习降噪,得到第二频域近端音频信号;基于所述频域远端参考音频信号、所述频域近端采集音频信号、所述第一频域近端音频信号和所述第二频域近端音频信号,对所述第二频域近端音频信号进行非线性回声消除,得到频域近端音频增强信号;对所述频域近端音频增强信号进行时频逆变换,得到近端音频增强信号。2.如权利要求1所述的音频信号处理方法,其特征在于,所述对所述第一频域近端音频信号的幅度进行深度学习降噪,得到第二频域近端音频信号,包括:通过训练好的降噪神经网络模型,对所述第一频域近端音频信号的幅度进行深度学习降噪,得到所述第二频域近端音频信号的幅度;根据所述第二频域近端音频信号的幅度和所述第一频域近端音频信号的相位,得到所述第二频域近端音频信号。3.如权利要求2所述的音频信号处理方法,其特征在于,所述通过训练好的降噪神经网络模型,对所述第一频域近端音频信号的幅度进行深度学习降噪,得到所述第二频域近端音频信号的幅度,包括:将所述第一频域近端音频信号的幅度输入所述训练好的降噪神经网络模型中,得到第一信号幅度比,其中,所述第一信号幅度比为所述第二频域近端音频信号的幅度和所述第一频域近端音频信号的幅度的比值的预测值;根据所述第一信号幅度比和所述第一频域近端音频信号的幅度,得到所述第二频域近端音频信号的幅度,其中,所述第二频域近端音频信号的幅度是所述第一信号幅度比和所述第一频域近端音频信号的幅度的乘积。4.如权利要求1所述的音频信号处理方法,其特征在于,所述基于所述频域远端参考音频信号、所述频域近端采集音频信号、所述第一频域近端音频信号和所述第二频域近端音频信号,对所述第二频域近端音频信号进行非线性回声消除,得到频域近端音频增强信号,包括:将所述频域远端参考音频信号分别与所述频域近端采集音频信号和第二频率近端音频信号在各个频带上进行求相关,得到各个频带的第二信号幅度比;根据所述第二信号幅度比、所述第一频域近端音频信号和所述第二频域近端音频信号,对所述第二频域近端音频信号进行非线性回声消除,得到频域近端音频增强信号。5.如权利要求4所述的音频信号处理方法,其特征在于,所述根据所述第二信号幅度比、所述第一频域近端音频信号和所述第二频域近端音频信号,对所述第二频域近端音频信号...

【专利技术属性】
技术研发人员:张旭郑羲光李楠韩润强张晨
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1