【技术实现步骤摘要】
一种基于FPGA的麦克风阵列定向拾音方法
[0001]本专利技术涉及声阵列信号采集和信号处理领域,特别涉及一种基于FPGA的麦克风阵列定向拾音方法。
技术介绍
[0002]人耳能够在复杂的声学环境中,将注意力集中到某一个人身上并且忽略背景噪声和其他人的干扰,获取有用的信息,是一种“鸡尾酒会效应”,其本质是人类的一种听力选择能力。之所以具有这种能力,主要是因为人体的双耳结构形成的指向性。同理,机器的“耳朵”,亦即麦克风也必须使得接收样本能包含指向性的方向信息。所谓“定向拾音”,其最直观的效果就是通过空域波束形成算法,获取当前空间中感兴趣方向输入的声学信息,并且屏蔽其它方向的干扰声学信号以及抑制存在于整个空间中的环境本底噪声,本质上属于多通道语音增强技术范畴,故而其实施载体必然是声阵列系统。
[0003]声阵列信号处理的技术难点在于:
[0004]1、受待处理信号的物理特性限制:接收信号是声波信号,作为宽带语音信号,典型频带处于300~3400Hz,接收阵列对此类信号源形成非相干阵,各阵元接收信号并非只是相位上的差异,不能直接加权相加;作为非平稳随机信号,需要做预处理,如抗混叠滤波、预加重、加窗、分帧以保证接收信号的短时平稳,从而获得更低失真更高音质的数字信号。另外,接收信号通常是机械纵波,由于波的反射、衍射,麦克风收到的信号除了直达信号以外,还有多径信号的叠加和干涉,产生声学混响;在室内环境中,受房间边界或者障碍物衍射和反射导致声信号传播到每个阵元的幅度和相位发生了未知的变化。
[0005]2、 ...
【技术保护点】
【技术特征摘要】
1.一种基于FPGA的麦克风阵列定向拾音方法,其特征在于,包括以下步骤:步骤1、FPGA接收上位机发送来的不同声源的位置信息,这些位置信息包含1个目标声源以及J个(J≥2)干扰声源的方位角和俯仰角信息;FPGA同步采集48阵元的麦克风阵列的输出字并通过I2S解码得到的48kHz、24bit、48
‑
CH并行脉冲编码调制数字流;FPGA分别基于上述的J+1个声源的位置信息(即方位角
‑
俯仰角组),对48CH的PCM数字流进行自适应波束形成计算;最终FPGA输出48kHz、24bit、(J+1)
‑
CH PCM数字流,这J+1路信号分别在空间上对齐了各个声源信号的方位角
‑
俯仰角组;步骤2、对于步骤1输出的48kHz、24bit、(J+1)
‑
CH数字PCM流进行系统信号干扰比提升处理;FPGA将步骤1得到的J+1路分别对齐1个目标和J个干扰方向的方位角
‑
俯仰角组,以24k点数的矩形窗进行加窗的短时傅里叶变换,并分别计算互功率谱;对传统最小均方误差准则下的带维纳后置滤波的最优权值进行改进,所述改进包含两处,添加一个可变向量α以改善加权效果,干扰信号拓展至J个;将改进后的权值与目标方向的频域加权,最后将加权结果逆变换至时域单通道去非平稳干扰信号;最终输出48kHz、24bit、1
‑
CH数字PCM流,为经过频域加权的单路目标方向输出信号S(n)直接输出至声卡并发声于外接耳机。2.如权利要求1所述基于FPGA的麦克风阵列定向拾音方法,其特征在于,所述步骤1具体如下:步骤1.1、上位机发送给FPGA的位置信息包括空域滤波的1个目标位置和J个干扰位置其中表示方位角
‑
俯仰角组、下角标s表示目标、uj表示第j个干扰;步骤1.2、根据步骤1.1的方位角和俯仰角信息,将
‑
80
°
到80
°
映射为整数量化的
‑
4到4作为抽头延迟线的长度,采用映射于不同角度信息的长度的抽头延迟线进行固定权值延时;在空域上先执行6行横向排列的麦克风的自适应滤波求和,得到6路分别对齐1个目标和J个干扰方向方位角θ的合计6*(J+1)
‑
CH信号,再在纵向方向上执行6路的自适应滤波求和,得到对齐1个目标和J个干扰方向俯仰角的(J+1)
‑
CH信号;自适应波束形成又称为多通道自适应滤波求和,其公式表示为其中y(n)表示多通道滤波求和的输出信号,x
i
(n)表示第i个麦克风的接收信号,n表示时域上的采样点,h=
‑
4,
‑
3...,0,...3,4,M指当前用于滤波求和使用的麦克风阵元数量,在执行横向麦克风自适应滤波求和时为8,在执行纵向麦克风自适应滤波求和时为6,L指滤波器的抽头数,w
i
(l)指的是滤波器的抽头系数(权向量),该权向量系数将基于线性约束最小方差原则进行自适应的更新,更新公式为:其中μ=0.0001表示学习步长;步骤1.3、横向对齐方位角的自适应波束形成需要消耗(L
‑
1)*(J+1)*6*8个延时单元、
(L
‑
1)*(J+1)*6*8个加法器和L*(J+1)*6*8个乘...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。