【技术实现步骤摘要】
一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法
[0001]本专利技术属于信号处理
,涉及一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法。
技术介绍
[0002]由于各种平稳及非平稳噪声的干扰,语音信号所包含的有效信息会被稀释,因此为了使传递的信息更容易辨别,需要对音频信号进行语音增强处理。语音增强是一种从带噪语音信号中提取目标信号,抑制噪声干扰的技术,在语音信号处理的各个领域都有着广泛的应用。语音增强主要分为单通道语音增强和多通道语音增强:单通道语音增强技术通常对噪声进行谱估计,然后从音频中减去估计的噪声信号来得到期望语音信号,如谱减法等,单通道语音增强很大程度上依赖于噪声信号的平稳性;多通道语音增强技术不仅能利用语音信号的非平稳特性,还可以根据不同信号的空间特征来实现更出色的语音增强效果。
[0003]通常人们的交流会受到环境噪声和混响的干扰,在这种情况下音频信号可以看作期望语音信号、伪平稳噪声信号以及干扰语音信号相互叠加而成,其中伪平稳信号可以利用广义旁瓣对消器有效地滤除,根据波束形成器输出与参考噪声 ...
【技术保护点】
【技术特征摘要】
1.一种基于麦克风阵列的广义旁瓣对消器及后置滤波算法,其特征在于,包括步骤如下:步骤1:从录制缓冲区提取数据,除首段数据外的其余段每次提取一段长度的数据,且长度为窗口长度N的整数倍;对首段数据扩充一个窗口提取;步骤2:通过麦克风阵列采集音频信号z(t),并设x(t)为期望语音信号,d
s
(t)为伪平稳噪声信号,d
t
(t)为干扰语音信号,i表示传感器的索引,则音频信号表示为:z
i
(t)=x
i
(t)+d
is
(t)+d
it
(t)
ꢀꢀꢀꢀꢀꢀꢀ
(1)利用窗函数将音频信号z(t)在时间上划分为重叠帧,窗长为N;以f
s
为采样率对音频信号进行离散傅里叶变换处理,得到各频段的中心频率f(k)和频域信号Z(n,k):Z(n,k)=X(n,k)+D
s
(n,k)+D
t
(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,k表示频段索引且k∈[1,N],n表示帧索引;段索引且k∈[1,N],n表示帧索引;段索引且k∈[1,N],n表示帧索引;段索引且k∈[1,N],n表示帧索引;其中,M表示传感器的数量,[
·
]
T
表示转置变换;步骤3:广义旁瓣对消器中的上支路是一个固定波束形成器,通过期望语音信号到达各麦克风的相对时延进行相位补偿,并对各麦克风采集信号的功率谱密度进行求和平均得到固定波束形成的输出信号Y
FBF
(n,k);设θ1表示Z(n,k)到达麦克风时相对于坐标原点的角度,θ2表示麦克风对波达方向估计的误差,估计期望语音信号X(n,k)到达麦克风阵列的角度:其中,l为传感器间的距离,c为声音在空气中的传播速率;根据Δ
k
建立固定波束形成器的权重向量W(k),并根据W(k)的延迟模型构建一个延迟相减向量B(k);W(k)和B(k)表示为如下形式:减向量B(k);W(k)和B(k)表示为如下形式:其中,k
BF
=(
‑
1)
i
‑1,[
·
]
H
表示共轭转置;音频信号Z(n,k)分别经过W(k)和B(k)得到Y
FBF
(n,k)和U(n,k),经自适应噪声对消器滤波后得到广义旁瓣对消器的输出信号Y(n,k):U(n,k)=B
H
(k)Z(n,k)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(11)Y(n,k)=Y
FBF
(n,k)
‑
H
*
(n,k)U(n,k)
ꢀꢀꢀ
(12)其中,Y
FBF
(n,k)=W
H
(k)Z(n,k),H(n,k)为自适应滤波器的权值系数,(
·
)
*
表示复数的
共轭;步骤4:令表示伪平稳噪声信号的功率谱密度,通过求解如下无约束优化问题,使伪平稳噪声功率谱密度达到最小:得到H(n,k)的维纳
‑
霍夫解:霍夫解:与噪声的空间相干函数Γ
s
(n,k)相关,在扩散噪声场中,Γ
s
(n,k)用sinc函数表示Γ
s
(n,k),即:用Γ
s
(n,k)来表示H(n,k),即:其中,表示取复数的虚部,表示取复数的实部;步骤5:由于波达方向的估计误差、混响以及强噪声的干扰,Y(n,k)既包含了纯净语音分量,又带有未完全消除的噪声分量;期望信号X(n,k)部分泄露到U(n,k)中,采用后置滤波来进一步滤除Y(n,k)中的噪声分量;后置滤波中,估计噪声功率谱密度之前,检测语音信号是否活跃;设b为一个归一化的频率平滑汉宁窗向量,Y
mat
(n,k)和U
mat
(n,k)分别为Y(n,k)和U(n,k)的频率对齐向量,且长度与b相同,计算Y(n,k)和U(n,k)的平滑功率谱密度:滑功率谱密度:其中,α
s
为时间平滑参数;在语音信号不活跃时,根据改进的最小控制递归平均法,估计背景伪平稳噪声的功率谱密度MY(n,k)和MU(n,k),并分别计算出Y(n,k)和U(n,k)的局部非平稳性:谱密度MY(n,k)和MU(n,k),并分别计算出Y(n,k)和U(n,k)的局部非平稳性:Λ0为局部非平稳性阈值;包含瞬态信号时,局部非平稳性超过Λ0;检测并计算Y(n,k)和U(n,k)的瞬态功率;当Λ
U
(n,k)超过Λ0但Λ
Y
(n,k)无波动时,当前音频信号为舍弃的干扰信号;当Λ
Y
(n,k)超过Λ0时,当前音频信号包含期望语音信号,对其进行保留与增强;为了进一步判断...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。