当前位置: 首页 > 专利查询>山东大学专利>正文

一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统技术方案

技术编号:17163382 阅读:18 留言:0更新日期:2018-02-01 21:19
本发明专利技术涉及一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统,包括步骤如下:(1)采集声音信号并存储;(2)对声音信号分离,得到独立声源信号;(3)对独立声源信号,通过模式匹配算法,选取需要定位的声音的独立声源信号;(4)根据模式匹配的结果,如果为单一声源,先粗定位:求取信号的包络,低分辨率采样,通过广义自相关函数法粗略计算时延,根据粗略定位的点数对信号进行时域搬移;再细定位:高分辨率采样,通过广义自相关函数法计算时延,得到精确时延,求解出声源位置;如果为多个声源,则通过TDOA算法计算时延,求解声源位置;相比传统的TDOA算法,此种算法可以一定程度上提高精度,并减少算法运算量。

An improved sound source localization method based on progressive serial orthogonalization blind source separation algorithm and its implementation system

The invention relates to an improved method of sound source localization progressive serial orthogonal blind source separation algorithm and its realization based on the system, including the following steps: (1) the sound signal acquisition and storage; (2) the separation of the sound signal, independent source signals; (3) the independent source signals, through pattern matching the algorithm, independent source signal selection needs to locate the sound; (4) according to the results of pattern matching, if a single sound source, coarse positioning: calculate the envelope signal, low resolution sampling, the generalized autocorrelation function method calculated the delay, according to rough positioning points in time domain signal to shift again; fine positioning: high resolution sampling, the generalized autocorrelation function method to calculate the delay, get accurate delay, calculate the position of the sound source; if multiple sound sources, delay calculated by TDOA algorithm, calculate sound source Compared with the traditional TDOA algorithm, this algorithm can improve the accuracy to a certain extent and reduce the computational complexity of the algorithm.

【技术实现步骤摘要】
一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统
本专利技术涉及一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统,属于声源定位

技术介绍
声音是自然界中信息传播的一个重要载体,通过获取声音信号,人们不单能获取到声音承载的语音信息,还能根据声音传播的特性和传播路径本身,通过声源定位技术,还可以获取声音承载的内容信息之外的位置信息。根据声音的这两种特性,所以声音信号的获取在安全监控、定位搜寻、区域探测等领域有着不可替代的作用。早先对于未知目标位置的定位方法主要依靠无线电、激光、超声等方式进行,通过主动发射探测信号并接收经被测物体反射回来的反射波来分析和计算被测物体的位置信息。因为是主动方式进行探测,发射和接收都要使用预先制定的频率波,所以不易受自然环境干扰,且具有高精度和高抗干扰的特性。但是主动式定位方式需要有强大的发射功率,这会在功率不足或某些能源限制环境下无法得到应用。而声源定位采用被动式原理,便于隐藏,使用广泛存在的声波,再加上设备成本低、功耗低,因而得到了广泛的关注和应用。盲源分离技术是20世纪90年代发展起来的一种信号处理方法,是在不知源信号和传输通道的参数的情况下,根据源信号的统计特性,仅由观测信号恢复出源信号各个成分的过程。这里的“源”指原始信号,即独立成分;“盲”一是源信号不能被观测到,二是源信号的混合方式未知,因此,在源信号与传输信道参数都未知的情况下,可以用盲源分离技术来处理混合声音信号。渐进串行正交化盲源分离算法是盲源分离算法的一种,通过渐进正交化的不动点迭代找到独立成分。基于到达时延的声源定位。假定一个以定速在空气中传播的声波,它到达位于不同位置的一对接收机的相位不同,根据接收机接收到的声音信号的相位差别,通过时延算法求得声音到各个接收端的时间差,进而求得声源位置。该定位算法有以下几个优点:一是设备要求不高;二是步骤简单,计算量小;二是方便与其它需要定位数据的系统结合。中国专利文献CN104181506A公开了一种基于改进PHAT加权时延估计的声源定位方法,该系统由麦克风阵列采集4路声音信号,通过A/D采样电路转化为数字信号,并通过改进的PHAT加权广义互相关函数法进行时延估计算法处理,获得时延估计值,再结合放置的麦克风阵列空间位置,利用迭代法解非线性方程组,从而得到声源的相对位置。但是,该专利所述系统不能辨识多个声源,也不能分辨带有方向性的噪声。中国专利文献CN104614069A公开了基于联合近似对角化盲源分离算法的电力设备故障音检测方法,具体步骤包括:(1)采用麦克风阵列;(2)采用基于联合近似对角化盲源分离算法针对步骤(1)采用麦克风阵列采集的声音信号分离各个独立声源信号;(3)提取独立声源信号的Mel频率倒谱系数MFCC作为声音特征参数,通过模式匹配算法识别声音信号,将待测试声音模板与所有的参考样本模板进行匹配后,匹配距离最小的参考样本模板就是电力设备工作音识别的结果。但是该专利采用的联合近似对角化算法的性能受协方差矩阵数量的影响较大,当矩阵的数量越大时,运算越复杂。
技术实现思路
为了克服现有声源定位方法中不能辨识多个声源的不足,本专利技术提出了一种基于渐进串行正交化盲源分离算法的改进声源定位方法;本专利技术还提出了上述改进声源定位方法的实现系统。本专利技术的技术方案为:一种基于渐进串行正交化盲源分离算法的改进声源定位方法,包括步骤如下:(1)通过麦克风阵列采集声音信号并存储;(2)采用基于渐进串行正交化盲源分离算法对步骤(1)采集到的声音信号分离,得到各个独立声源信号;(3)对步骤(2)得到的每个独立声源信号,提取梅尔频率倒谱系数(MFCC)作为声音特征参数,通过模式匹配算法识别声音信号,选取需要定位的声音的独立声源信号;(4)根据步骤(3)中模式匹配的结果,如果为单一声源,则进入步骤(5);如果为多个声源,则通过TDOA算法计算时延,求解声源位置;(5)先粗定位:求取信号的包络,低分辨率采样,通过广义自相关函数法粗略计算时延,根据粗略定位的点数对信号进行时域搬移;再细定位:高分辨率采样,通过广义自相关函数法计算时延,得到精确时延,求解声源位置。传统的TDOA算法中,时延估计的精度受到采样频率的限制,所需精度越高,所需采样频率就越高,对于相同的采样时长,高采样频率带来极高的采样点数,算法的运算量也就越大。粗定位细定位算法中,先采用低分辨率对信号进行一定的时域搬移,再采用高分辨率进行高精度时延校准。较于低分辨率采样的传统算法,此种算法可以达到高分辨率采样的计算精度;较于高分辨率采样的传统算法,此算法因进行过一次时域搬移,在高精度校准时只需较短的有效时长即可将时延计算出来,减少了算法运算量;基于上述原理,该算法可以解决采样MIC之间的距离限制,当时延超出有效时长的距离时,只需进行一次粗定位时域搬移,即可计算精确时延。根据本专利技术优选的,根据所述步骤(5)得到精确时延,包括步骤如下:A、设定通过步骤(3)获取4路声音信号,即x1(t)、x2(t)、x3(t)、x4(t),t为数字信号中采样点的序号,长度为N,将4路声音信号进行加窗滤波处理,消除噪声;B、对4路信号进行包络提取,只取包络的上半部分为有效信号,以Fs/n的频率进行抽点采样,得x′1(t)、x′2(t)、x′3(t)、x′4(t),Fs为盲源分离时的采样频率,n为大于1的整数;C、对x′1(t)、x′2(t)、x′3(t)、x′4(t)进行傅立叶变换到频域,即X′1(k)、X′2(k)、X′3(k)、X′4(k),其中k为与t对应的数字信号中采样点的序号,t、k均为整数;D、将x′1(t)作为基准信号,分别计算X′1(k)与X′2(k)、X′1(k)与X′3(k)、X′1(k)与X′4(k)的互功率谱G′12(k)、G′13(k)、G′14(k),对互功率谱G′12(k)、G′13(k)、G′14(k)进行PHAT加权操作,如式(Ⅰ)、式(Ⅱ)、式(Ⅲ)所示:式(Ⅰ)、式(Ⅱ)、式(Ⅲ)中,X′1*(k)为X′1(k)的共轭;E、将互功率谱G′12(k)、G′13(k)、G′14(k)逆变换到频域,得到对应的广义互相关函数R′12(t)、R′13(t)、R′14(t);当R′12(t)、R′13(t)、R′14(t)分别取最大值时n所对应的时延即为3路声音信号x′2(t)、x′3(t)、x′4(t)与基准信号x′1(t)的时延估计t′12、t′13、t′14;设R′1s(t)取最大值时t的值为n′1s,s=2、3、4,所取声音信号的点数为N′=fix(N/n),采样频率为Fs/n,若n′1s>N′/2,则n′1s更新为n′1s-N′-1;若n′1s≤N′/2,则n′1s不变;由此计算得到n′12、n′13、n′14;F、若n′1s≥0,将x1(t)在时域上向左平移n′1s*n个点;若n′1s<0,xs(t)在时域上向右平移n′1s*n个点;取x1(t)、xs(t)前N1个点信号为z(t)、zs(t),N1为大于2n小于N的整数;N1为信号长度,Fs为采样频率;按照步骤C-E采用广义自相关求取精确时延点数n″12,即将信号z1(t)、z2(t)傅立叶变换本文档来自技高网
...
一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统

【技术保护点】
一种基于渐进串行正交化盲源分离算法的改进声源定位方法,其特征在于,包括步骤如下:(1)通过麦克风阵列采集声音信号并存储;(2)采用基于渐进串行正交化盲源分离算法对步骤(1)采集到的声音信号分离,得到各个独立声源信号;(3)对步骤(2)得到的每个独立声源信号,提取梅尔频率倒谱系数作为声音特征参数,通过模式匹配算法识别声音信号,选取需要定位的声音的独立声源信号;(4)根据步骤(3)中模式匹配的结果,如果为单一声源,则进入步骤(5);如果为多个声源,则通过TDOA算法计算时延,求解声源位置;(5)先粗定位:求取信号的包络,低分辨率采样,通过广义自相关函数法粗略计算时延,根据粗略定位的点数对信号进行时域搬移;再细定位:高分辨率采样,通过广义自相关函数法计算时延,得到精确时延,求解声源位置。

【技术特征摘要】
1.一种基于渐进串行正交化盲源分离算法的改进声源定位方法,其特征在于,包括步骤如下:(1)通过麦克风阵列采集声音信号并存储;(2)采用基于渐进串行正交化盲源分离算法对步骤(1)采集到的声音信号分离,得到各个独立声源信号;(3)对步骤(2)得到的每个独立声源信号,提取梅尔频率倒谱系数作为声音特征参数,通过模式匹配算法识别声音信号,选取需要定位的声音的独立声源信号;(4)根据步骤(3)中模式匹配的结果,如果为单一声源,则进入步骤(5);如果为多个声源,则通过TDOA算法计算时延,求解声源位置;(5)先粗定位:求取信号的包络,低分辨率采样,通过广义自相关函数法粗略计算时延,根据粗略定位的点数对信号进行时域搬移;再细定位:高分辨率采样,通过广义自相关函数法计算时延,得到精确时延,求解声源位置。2.根据权利要求1所述的一种基于渐进串行正交化盲源分离算法的改进声源定位方法,其特征在于,根据所述步骤(5)得到精确时延,包括步骤如下:A、设定通过步骤(3)获取4路声音信号,即x1(t)、x2(t)、x3(t)、x4(t),t为数字信号中采样点的序号,长度为N,将4路声音信号进行加窗滤波处理,消除噪声;B、对4路信号进行包络提取,只取包络的上半部分为有效信号,以Fs/n的频率进行抽点采样,得x′1(t)、x′2(t)、x′3(t)、x′4(t),Fs为盲源分离时的采样频率,n为大于1的整数;C、对x′1(t)、x′2(t)、x′3(t)、x′4(t)进行傅立叶变换到频域,即X1′(k)、X2′(k)、X3′(k)、X4′(k),其中k为与t对应的数字信号中采样点的序号,t、k均为整数;D、将x′1(t)作为基准信号,分别计算X1′(k)与X2′(k)、X1′(k)与X3′(k)、X1′(k)与X4′(k)的互功率谱G1′2(k)、G113(k)、G1′4(k),对互功率谱G1′2(k)、G1′3(k)、G1′4(k)进行PHAT加权操作,如式(Ⅰ)、式(Ⅱ)、式(Ⅲ)所示:式(Ⅰ)、式(Ⅱ)、式(Ⅲ)中,为X1′(k)的共轭;E、将互功率谱G′12(k)、G′13(k)、G′14(k)逆变换到频域,得到对应的广义互相关函数R′12(t)、R′13(t)、R′14(t);当R′12(t)、R′13(t)、R′14(t)分别取最大值时n所对应的时延即为3路声音信号x′2(t)、x′3(t)、x′4(t)与基准信号x′1(t)的时延估计t′12、t′13、t′14;设R′1s(t)取最大值时t的值为n′1s,s=2、3、4,所取声音信号的点数为N′=fix(N/n),采样频率为Fs/n,若n′1s>N′/2,则n′1s更新为n′1s-N′-1;若n′1s≤N′/2,则n′1s不变;由此计算得到n′12、n′13、n′14;F、若n′1s≥0,将x1(t)在时域上向左平移n′1s*n个点;若n′1s<0,xs(t)在时域上向右平移n′1s*n个点;取x1(t)、xs(t)前N1个点信号为z(t)、zs(t),N1为大于2n小于N的整数;N1为信号长度,Fs为采样频率;按照步骤C-E采用广义自相关求取精确时延点数n″12,即将信号z1(t)、z2(t)傅立叶变换到频域,PHAT加权计算互功率谱,然后傅立叶反变换到时域求得互相关函数,取互相关最大时点数所对应的时间为两路的时延估计n″13,n″13和n″14与n″12计算方法一致;G、则x1(t)、x2(t)的时延同理3.根据权利要求1所述的一种基于渐进串行正交化盲源分离算法的改进声源定位方法,其特征在于,所述步骤(4),如果为多个声源,则通过TDOA算法计算时延,包括步骤如下:a、设定步骤(2)获取需要进行定位的独立分量为yi(t),i为整数且1≤i≤4,t为数字信号中采样点的序号,将yi(t)、x1(t)、x2(t)、x3(t)、x4(t)这5路信号进行加窗滤波处理,再经傅立叶变换到频域,得到频域信号Yi(k)、X1(k)、X2(k)、X3(k)、X4(k),k为与t对应的数字信号采样点的序号;b、将独立分量yi(t)作为基准信号,分别计算Yi(k)与X1(k)、Yi(k)与X2(k)、Yi(k)与X3(k)、Yi(k)与X4(k)的互功率谱,即Gi1(k)、Gi2(k)、Gi3(k)、Gi4(k),对互功率谱Gi1(k)、Gi2(k)、Gi3(k)、Gi4(k)进行PHAT加权操作,如式(Ⅳ)、(Ⅴ)、(Ⅵ)、(Ⅶ)所示:式(Ⅳ)、(Ⅴ)、(Ⅵ)、(Ⅶ)中,Yi*为Yi(k)的共轭,为PHAT函数;c、将互功率谱Gi1(k)、Gi2(k)、Gi3(k)、Gi4(k)逆变换到频域,得到对应的广义互相关函数Ri1(n)、Ri2(n)、Ri3(n)、Ri4(n),当Ri1(n)、Ri2(n)、Ri3(n)、Ri4(n)分别取最大值时,n所对应的时延即为4路声音信号x1(t)、x2(t)、x3(t)、x4(t)与基准信号yi(t)的时延估计ti1、ti2、ti3、ti4,设Ri1(n)取最大值时的n的值为ni1,所取声音信号的点数为N,采样频率为Fs,若ni1>N/2,则若ni1≤N/2,则设Ri2(n)取最大值时的n的值为ni2,所取声音信号的点数为N,采样频率为Fs,若ni2>N/2,则若ni2≤N/2,则设Ri3(n)取最大值时的n的值为ni3,所取声音信号的点数为N,采样频率为Fs,若ni3>N/2,则若ni3≤N/2,则设Ri4(n)取最大值时的n的值为ni4,所取声音信号的点数为N,采样频率为Fs,若ni4>N/2,则若ni4≤N/2,则d、将ti1作为基准延时,则t12=ti1-ti2表示x1(t)相对于x2(t)的延时,t13=ti1-ti3表示x1(t)相对于x3(t)的延时,t14=ti1-ti4表示x1(t)相对于x4(t)的延时,得到x1(t)相对于x2(t)、x3(t)、x4(t)的延时t12、t13、t14。4.根据权利要求2或3所述的一种基于渐进串行正交化盲源分离算法的改进声源定位方法,其特征在于,所述步骤(4)、(5)中,求解声源位置,包括:设定声源位置坐标为(x,y,z),得到延时参数以后,通过式(Ⅷ)求取声源位置坐标:

【专利技术属性】
技术研发人员:周冉冉崔浩王永郭晓宇倪暹
申请(专利权)人:山东大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1