The invention relates to an improved method of sound source localization progressive serial orthogonal blind source separation algorithm and its realization based on the system, including the following steps: (1) the sound signal acquisition and storage; (2) the separation of the sound signal, independent source signals; (3) the independent source signals, through pattern matching the algorithm, independent source signal selection needs to locate the sound; (4) according to the results of pattern matching, if a single sound source, coarse positioning: calculate the envelope signal, low resolution sampling, the generalized autocorrelation function method calculated the delay, according to rough positioning points in time domain signal to shift again; fine positioning: high resolution sampling, the generalized autocorrelation function method to calculate the delay, get accurate delay, calculate the position of the sound source; if multiple sound sources, delay calculated by TDOA algorithm, calculate sound source Compared with the traditional TDOA algorithm, this algorithm can improve the accuracy to a certain extent and reduce the computational complexity of the algorithm.
【技术实现步骤摘要】
一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统
本专利技术涉及一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统,属于声源定位
技术介绍
声音是自然界中信息传播的一个重要载体,通过获取声音信号,人们不单能获取到声音承载的语音信息,还能根据声音传播的特性和传播路径本身,通过声源定位技术,还可以获取声音承载的内容信息之外的位置信息。根据声音的这两种特性,所以声音信号的获取在安全监控、定位搜寻、区域探测等领域有着不可替代的作用。早先对于未知目标位置的定位方法主要依靠无线电、激光、超声等方式进行,通过主动发射探测信号并接收经被测物体反射回来的反射波来分析和计算被测物体的位置信息。因为是主动方式进行探测,发射和接收都要使用预先制定的频率波,所以不易受自然环境干扰,且具有高精度和高抗干扰的特性。但是主动式定位方式需要有强大的发射功率,这会在功率不足或某些能源限制环境下无法得到应用。而声源定位采用被动式原理,便于隐藏,使用广泛存在的声波,再加上设备成本低、功耗低,因而得到了广泛的关注和应用。盲源分离技术是20世纪90年代发展起来的一种信号处理方法,是在不知源信号和传输通道的参数的情况下,根据源信号的统计特性,仅由观测信号恢复出源信号各个成分的过程。这里的“源”指原始信号,即独立成分;“盲”一是源信号不能被观测到,二是源信号的混合方式未知,因此,在源信号与传输信道参数都未知的情况下,可以用盲源分离技术来处理混合声音信号。渐进串行正交化盲源分离算法是盲源分离算法的一种,通过渐进正交化的不动点迭代找到独立成分。基于到达时延的声源定位。 ...
【技术保护点】
一种基于渐进串行正交化盲源分离算法的改进声源定位方法,其特征在于,包括步骤如下:(1)通过麦克风阵列采集声音信号并存储;(2)采用基于渐进串行正交化盲源分离算法对步骤(1)采集到的声音信号分离,得到各个独立声源信号;(3)对步骤(2)得到的每个独立声源信号,提取梅尔频率倒谱系数作为声音特征参数,通过模式匹配算法识别声音信号,选取需要定位的声音的独立声源信号;(4)根据步骤(3)中模式匹配的结果,如果为单一声源,则进入步骤(5);如果为多个声源,则通过TDOA算法计算时延,求解声源位置;(5)先粗定位:求取信号的包络,低分辨率采样,通过广义自相关函数法粗略计算时延,根据粗略定位的点数对信号进行时域搬移;再细定位:高分辨率采样,通过广义自相关函数法计算时延,得到精确时延,求解声源位置。
【技术特征摘要】
1.一种基于渐进串行正交化盲源分离算法的改进声源定位方法,其特征在于,包括步骤如下:(1)通过麦克风阵列采集声音信号并存储;(2)采用基于渐进串行正交化盲源分离算法对步骤(1)采集到的声音信号分离,得到各个独立声源信号;(3)对步骤(2)得到的每个独立声源信号,提取梅尔频率倒谱系数作为声音特征参数,通过模式匹配算法识别声音信号,选取需要定位的声音的独立声源信号;(4)根据步骤(3)中模式匹配的结果,如果为单一声源,则进入步骤(5);如果为多个声源,则通过TDOA算法计算时延,求解声源位置;(5)先粗定位:求取信号的包络,低分辨率采样,通过广义自相关函数法粗略计算时延,根据粗略定位的点数对信号进行时域搬移;再细定位:高分辨率采样,通过广义自相关函数法计算时延,得到精确时延,求解声源位置。2.根据权利要求1所述的一种基于渐进串行正交化盲源分离算法的改进声源定位方法,其特征在于,根据所述步骤(5)得到精确时延,包括步骤如下:A、设定通过步骤(3)获取4路声音信号,即x1(t)、x2(t)、x3(t)、x4(t),t为数字信号中采样点的序号,长度为N,将4路声音信号进行加窗滤波处理,消除噪声;B、对4路信号进行包络提取,只取包络的上半部分为有效信号,以Fs/n的频率进行抽点采样,得x′1(t)、x′2(t)、x′3(t)、x′4(t),Fs为盲源分离时的采样频率,n为大于1的整数;C、对x′1(t)、x′2(t)、x′3(t)、x′4(t)进行傅立叶变换到频域,即X1′(k)、X2′(k)、X3′(k)、X4′(k),其中k为与t对应的数字信号中采样点的序号,t、k均为整数;D、将x′1(t)作为基准信号,分别计算X1′(k)与X2′(k)、X1′(k)与X3′(k)、X1′(k)与X4′(k)的互功率谱G1′2(k)、G113(k)、G1′4(k),对互功率谱G1′2(k)、G1′3(k)、G1′4(k)进行PHAT加权操作,如式(Ⅰ)、式(Ⅱ)、式(Ⅲ)所示:式(Ⅰ)、式(Ⅱ)、式(Ⅲ)中,为X1′(k)的共轭;E、将互功率谱G′12(k)、G′13(k)、G′14(k)逆变换到频域,得到对应的广义互相关函数R′12(t)、R′13(t)、R′14(t);当R′12(t)、R′13(t)、R′14(t)分别取最大值时n所对应的时延即为3路声音信号x′2(t)、x′3(t)、x′4(t)与基准信号x′1(t)的时延估计t′12、t′13、t′14;设R′1s(t)取最大值时t的值为n′1s,s=2、3、4,所取声音信号的点数为N′=fix(N/n),采样频率为Fs/n,若n′1s>N′/2,则n′1s更新为n′1s-N′-1;若n′1s≤N′/2,则n′1s不变;由此计算得到n′12、n′13、n′14;F、若n′1s≥0,将x1(t)在时域上向左平移n′1s*n个点;若n′1s<0,xs(t)在时域上向右平移n′1s*n个点;取x1(t)、xs(t)前N1个点信号为z(t)、zs(t),N1为大于2n小于N的整数;N1为信号长度,Fs为采样频率;按照步骤C-E采用广义自相关求取精确时延点数n″12,即将信号z1(t)、z2(t)傅立叶变换到频域,PHAT加权计算互功率谱,然后傅立叶反变换到时域求得互相关函数,取互相关最大时点数所对应的时间为两路的时延估计n″13,n″13和n″14与n″12计算方法一致;G、则x1(t)、x2(t)的时延同理3.根据权利要求1所述的一种基于渐进串行正交化盲源分离算法的改进声源定位方法,其特征在于,所述步骤(4),如果为多个声源,则通过TDOA算法计算时延,包括步骤如下:a、设定步骤(2)获取需要进行定位的独立分量为yi(t),i为整数且1≤i≤4,t为数字信号中采样点的序号,将yi(t)、x1(t)、x2(t)、x3(t)、x4(t)这5路信号进行加窗滤波处理,再经傅立叶变换到频域,得到频域信号Yi(k)、X1(k)、X2(k)、X3(k)、X4(k),k为与t对应的数字信号采样点的序号;b、将独立分量yi(t)作为基准信号,分别计算Yi(k)与X1(k)、Yi(k)与X2(k)、Yi(k)与X3(k)、Yi(k)与X4(k)的互功率谱,即Gi1(k)、Gi2(k)、Gi3(k)、Gi4(k),对互功率谱Gi1(k)、Gi2(k)、Gi3(k)、Gi4(k)进行PHAT加权操作,如式(Ⅳ)、(Ⅴ)、(Ⅵ)、(Ⅶ)所示:式(Ⅳ)、(Ⅴ)、(Ⅵ)、(Ⅶ)中,Yi*为Yi(k)的共轭,为PHAT函数;c、将互功率谱Gi1(k)、Gi2(k)、Gi3(k)、Gi4(k)逆变换到频域,得到对应的广义互相关函数Ri1(n)、Ri2(n)、Ri3(n)、Ri4(n),当Ri1(n)、Ri2(n)、Ri3(n)、Ri4(n)分别取最大值时,n所对应的时延即为4路声音信号x1(t)、x2(t)、x3(t)、x4(t)与基准信号yi(t)的时延估计ti1、ti2、ti3、ti4,设Ri1(n)取最大值时的n的值为ni1,所取声音信号的点数为N,采样频率为Fs,若ni1>N/2,则若ni1≤N/2,则设Ri2(n)取最大值时的n的值为ni2,所取声音信号的点数为N,采样频率为Fs,若ni2>N/2,则若ni2≤N/2,则设Ri3(n)取最大值时的n的值为ni3,所取声音信号的点数为N,采样频率为Fs,若ni3>N/2,则若ni3≤N/2,则设Ri4(n)取最大值时的n的值为ni4,所取声音信号的点数为N,采样频率为Fs,若ni4>N/2,则若ni4≤N/2,则d、将ti1作为基准延时,则t12=ti1-ti2表示x1(t)相对于x2(t)的延时,t13=ti1-ti3表示x1(t)相对于x3(t)的延时,t14=ti1-ti4表示x1(t)相对于x4(t)的延时,得到x1(t)相对于x2(t)、x3(t)、x4(t)的延时t12、t13、t14。4.根据权利要求2或3所述的一种基于渐进串行正交化盲源分离算法的改进声源定位方法,其特征在于,所述步骤(4)、(5)中,求解声源位置,包括:设定声源位置坐标为(x,y,z),得到延时参数以后,通过式(Ⅷ)求取声源位置坐标:
【专利技术属性】
技术研发人员:周冉冉,崔浩,王永,郭晓宇,倪暹,
申请(专利权)人:山东大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。