基于i-vector局部加权的光纤振动振源识别分类方法及系统技术方案

技术编号:22565678 阅读:32 留言:0更新日期:2019-11-16 12:16
本发明专利技术公开了一种基于i‑vector局部加权的光纤振动振源识别方法及系统。针对现有光纤振动预警系统中识别率低造成虚警较多,可用性差的问题,本发明专利技术提出基于i‑vector局部加权线性判别分析的振源声纹识别方法,在计算类内和类间散度时,增加待识别振动源近邻样本权重。在此基础上,通过提高待识别振源近邻域局部类间的分辨能力,减少因信道差异而产生的识别错误,从而在复杂信道环境下能够保持良好的鲁棒性。

Identification and classification method and system of optical fiber vibration source based on I-vector local weighting

The invention discloses an optical fiber vibration source identification method and system based on I \u2011 vector local weighting. In view of the problem that the low recognition rate in the existing optical fiber vibration early warning system results in more false alarms and poor availability, the invention proposes a vibration source voiceprint recognition method based on I \u2011 vector local weighted linear discriminant analysis, which increases the weight of the nearest neighbor samples of the vibration source to be identified when calculating the intra class and inter class dispersion. On this basis, by improving the resolution of the local classes near the neighborhood of the vibration source to be identified, the identification error caused by the channel difference is reduced, so that good robustness can be maintained in the complex channel environment.

【技术实现步骤摘要】
基于i-vector局部加权的光纤振动振源识别分类方法及系统
本专利技术涉及光纤听音、安防领域,特别是涉及基于i-vector局部加权的光纤振动振源识别分类方法及系统。
技术介绍
光纤振动传感器作为一种新型的振动采集传感器,可以实现长距离无缘探测,微小的扰动就可以使光纤由于振动而变形,传输轨迹也会相应变化。具有抗电磁和射频干扰、灵敏度高、安全可靠和保密性强等优点,特别适用于强电磁场、高射频、易燃易爆和军事安全等场合。但光纤振动对信号过于灵敏也造成误报率高,现多采用门限的方式来过滤虚警。目前门限上的处理设计思路主要是提取出信号的幅度特性,该幅度特性也包括杂波和噪声幅度变化,将提取到的幅度特性与门限比较,将高于门限的信号提取后报警。而门限值不能很好的反应光的振动情况。当光路及外部环境发生变化的时候无法进行自适应调整,因而可用性极差。而本专利技术利用光纤采集的振动数据可还原为音频,继而采用基于语音模式识别分类的方法进行,因此研究基于i-vector局部加权的光纤振动振源识别方法具有非常重要的理论价值和实际应用意义。
技术实现思路
本专利技术主要解决的技术问题是提供一种基于i-vector局部加权的反馈式光纤振动振源分类的方法及装置。由于光纤中瑞利散射的反馈光的反射强度调制,声纹识别系统通常采用线性鉴别分析(LDA)来消除训练和测试振源音频之间信道失配,不能保证样本在待识别振源近邻区域内具有最佳的分离度,这就使得在光纤振动系统中目标振源和其近邻间的得分差异较小,进而导致识别准确性下降。而近年来为了提高在信道失配条件下的识别鲁棒性,进一步提出了SN-LDA(sourcenormalisedlineardiscriminantanalysis)、WLDA(weightedlineardiscriminantanalysis),方法在计算类内和类间散度矩阵时,对所有的训练样本赋予相同的权重,然后求解出的投影矩阵可以最大化所有样本的平均类间散度和最小化平均类内散度。然而,这些方法没有很好地突出待识别振源音频近邻区域的局部分离度。为解决上述技术问题,更好的对目标振源进行识别分类,针对该问题本专利技术提出的一个技术方案是基于i-vector局部加权线性判别分析的目标振源识别方法(LWLDA)。在计算类内和类间散度时,增加待识别振源近邻样本权重。在此基础上,通过提高待识别振源近邻域局部类间的分辨能力,尽可能减少因信道差异而产生的识别错误。其中,所述基于i-vector局部加权线性判别分析的算法设计的步骤包括:线性判别分析与信道失配补偿。首先,本专利技术为了使目标振源所有信道条件下的声纹特征更加紧凑,引入了T子空间的概念。把振源音频的差异性用单一的更低维的T空间和残差来表示。对于一段振源音频,在T子空间里,超UBM均值向量可以表示为:M=m+Tx+ε(1)式(1)中,m为一个与特定目标振源和信道都无关的超向量,即由大量通用背景振源音频训练的UBM均值向量,代表所有人在所有信道条件下的超均值向量的平均值。T为T子空间矩阵,x为目标振源因子,其分布服从正态分布N(0,I),ε为残差,可视作噪声。M服从均值为m、协方差矩阵为TTT的正态分布。T子空间矩阵T可在训练集目标振源语音样本上由Map(maximumaposterior)算法生成,T子空间变化因子属于隐变量。在给定目标振源s第h段语音的特征和T子空间参数集的条件下,将i-vector记作us,h,将该段语音的0阶和1阶Baum-Welch统计量记为N(s,h)与F'(s,h),训练时的方差记为Σ,具体如式(2):us,h=(I+TTΣ-1N(s,h)T)-1TTΣ-1F'(s,h)(2)其中,在线性判别分析里,为了在保持目标振源声纹特征的同时并消除信道差异性,采用LDA投影实现2次降维,使得i-vector的维数远小于UBM均值超向量。目标振源特征us符合高斯分布N(0,1),类间和类内散度矩阵分别为:(3)(4)其中,ui为第i个目标振源语音样本的i-vector,Us为第s个目标振源的目标振源语音样本的i-vector均值,Uo为所有目标振源语音样本的i-vector均值。S为总目标振源个数,ns为第s个目标振源目标振源语音样本的个数。投影矩阵设为P,可用式(5)求解:SBv=λSWv(5)式(5)中:λ、v分别为SW-1SB所对应的特征值和特征向量。投影矩阵P由最大的前ND个特征值对应的特征向量组成,ND为投影后目标振源特征的维数。设i-vector为X,投影后的目标振源声纹特征为:Y=PTX(6)SN-LDA将SB重新定义为:SB=S1B+S2B(7)式中:S1B是针对麦克风语音计算的类间散度,S2B是针对光纤语音计算的类间散度。类内散度矩阵为:Sw=STOTAL-SB(8)STOTAL为总散度:(9)式中:N为所有类样本总数。在式(7)~(9)的基础上,首先根据式(5)求取投影矩阵,然后利用式(6)对i-vector进行投影变换。通过增加待识别振源音频近邻样本权重求解投影矩阵。由于待识别振源音频近邻域局部类间分辨能力得到了增强,因此提高了识别准确率。一方面,待识别振源音频近邻区域的局部类间分离度对识别结果的准确率影响更为重要;另一方面,同待识别振源音频距离较远区域的类间分离度并影响对识别结果的判决。因此可以重新计算类间散度SB、类内散度Sw如下:(10)(11)式(10)及式(11)中:ws为第s个目标振源的样本权值,若该目标振源语音样本是待识别振源音频的近邻,则令ws=1,否则ws=α。其中,α∈[0,1]为权重系数。当α∈(0,1)时,减小了待识别振源音频近邻以外样本的权重,等同于增加了近邻样本的权重。边界条件下,当α=0时,相当于只有待识别振源音频的近邻样本参与了训练;当α=1时,则LWLDA将退化成LDA。将SB和SW代入式(5)后,可以求取投影矩阵,然后结合式(6)对i-vector进行投影变换。可显著改善算法的收敛性能。利用语音库及自行采集的数据实验,测试结果如图4、图5、图6,证明基于瑞利散射的光纤振动系统采用i-vector局部线性加权算法够在复杂信道条件下始终保持良好的鲁棒性,可提高振源识别的准确率,从而提高系统的可用性。综上,可将前述LWLDA方法实现步骤归纳如下:步骤1:令所有ws=1;步骤2:利用训练振源音频的i-vector,根据式(10)和(11)分别计算SB和SW;步骤3:根据式(5),求得投影矩阵P;步骤4:根据式(6),对测试振源音频i-vector进行投影变换,生成新的特征向量;步骤5:对步骤4生成的新特征向量,计算登记目标振源语音样本和待识别振源音频样本的GPLDA得分;根据相似度,从高到低取前k个登记目标振源语音样本,将第k个样本和待识别振源音频样本的GPLDA得分设为θ;步骤6:根据式(6),对训练振源音频i-vector进行本文档来自技高网...

【技术保护点】
1.一种基于i-vector局部线性加权的光纤振动振源分类装置,其特征在于,包括:脉冲光路系统,分束器、APD光电转换器、数据采集卡、数据采集模块、i-vector预警识别模块、预警事件分类推送模块。/n

【技术特征摘要】
1.一种基于i-vector局部线性加权的光纤振动振源分类装置,其特征在于,包括:脉冲光路系统,分束器、APD光电转换器、数据采集卡、数据采集模块、i-vector预警识别模块、预警事件分类推送模块。


2.根据权利要求1所述的方法,脉冲光路系统用于产生脉冲光束,作为光纤振动传感介质的,其特征在于,包括:激光器、可调衰减器、调制器、驱动器、EDFA放大器、环形器等;
激光器发射稳定的光信号,通过驱动器进行脉冲控制,进而通过EDFA放大器进行能量放大、提高信噪比;
而后发射光通过环形器射出,反射光通过环形器接收并通过PBS分光器后进入APD光电转换,最终变为数字信号并上传。


3.根据权利要求1所述的方法,i-vector预警识别模块提高待识别振源样本近邻域局部类间的分辨能力,从而减少因信道差异而产生的识别错误,从而提高识别准确率;
在提取振源音频i-vector特征时,其特征在于,包括:采用T子空间参数集对振源i-vector特征进行标记作us,h,把语音的差异性用单一的更低维的T空间和残差来表示;
将该段目标振源的0阶和1阶Baum-Welch统计量,以及训练T矩阵时产生的方...

【专利技术属性】
技术研发人员:刘本刚张洁邓子璇顾宗随柴军杰魏嘉
申请(专利权)人:光子瑞利科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利