当前位置: 首页 > 专利查询>重庆大学专利>正文

公共场所异常声音特征提取方法技术

技术编号:14444438 阅读:106 留言:0更新日期:2017-01-15 09:02
本发明专利技术涉及公共场所异常声音特征提取方法,属于音频信号处理领域。声音特征提取方法基于自适应噪声的完备总体局部均值分解CELMDAN,引入分解嵌套思想。利用CELMDAN方法分解公共场所异常声音信号,得到一系列乘积函数(PF)分量。并将各PF分量与原始异常声音信号的能量比值作为其特征向量。最后输入支持向量机(SVM)进行分类。相比于目前常用的特征提取方法,本发明专利技术提出的CELMDAN方法更能够准确提取异常声音的特征,并且对环境背景噪声具有较好的鲁棒性。

【技术实现步骤摘要】

本专利技术属于音频信号特征提取及模式识别
,尤其涉及公共场所异常声音特征提取方法
技术介绍
公共场所如地铁、火车站、广场等具有地域广、人流量大等典型特点,是国家安全防卫最重要的部分之一。目前公共场所安全监控主要以视频监控为主。异常事件发生时产生的异常声音,包含异常事件大量的相关信息,因此音频监控已经成为公共安全监控领域研究的发展方向。目前现有的音频监控系统仅为简单的声音采集、传输等,缺乏对异常声音的有效识别,原因是音频监控核心理论及技术没有得到突破。局部均值分解(LocalMeanDecomposition,LMD)是目前音频信号处理采用的常用技术,但是LMD自身存在的端点效应、分解耗时及模态混叠问题。(1)公共场所异常声音信号具有极值点间距较小且分布紧密的特点,通常由于端点检测等预处理操作,异常声音信号的端点不是极值点,而LMD直接以端点值作为极值的处理方式是不合理的,其结果是生成的乘积函数(ProductFunction,PF)分量在两端出现虚假成分,随着分解过程的进行,这种失真现象从信号两端蔓延到中间,造成分解结果失真,即端点效应问题。(2)公共场所异常声音信号具有上下波动频繁、局部信息丰富的特点,而LMD的滑动平均过程不仅耗时而且易造成信号的某些局部信息损失。此外,异常声音信号持续时间较长且主要信息包含在高频部分,而LMD方法的PF分量阶数及筛选次数不确定都会造成分解耗时,同时也会影响分解效果。(3)公共场所异常声音信号频率成分复杂,而LMD的模态混叠问题会影响其特征提取效果。现有总体局部均值分解(EnsembleLocalMeanDecomposition,ELMD)方法虽能有效缓解模态混叠,但存在重构误差大、分量掺杂噪声信息等新问题。公共场所异常声音特征提取方法大多采用语音信号处理的典型参数或几种参数的组合,如短时过零率、短时平均能量、梅尔频率倒谱系数(Mel-FrequencyCepstrumCoefficient,MFCC)等,在一定范围取得较好的效果。但是由于异常声音信号的特殊性,上述参数提取特征的效果有很大局限。
技术实现思路
针对以上现有技术存在的问题,本专利技术的目的在于以局部均值分解LMD为基础进行相关改进,提出一种基于CELMDAN的公共场所异常声音特征提取方法,旨在解决将LMD应用于异常声音特征提取中面临的关键理论及技术难题,即一是LMD自身存在的端点效应、分解耗时及模态混叠问题;二是公共场所异常声音的特征提取问题。为实现专利技术目的采用的技术手段如下:公共场所异常声音特征提取方法,其特征在于:首先,采集公共场所异常声音信号,完成声音信号的预处理;然后,采用自适应噪声的完备总体局部均值分解CELMDAN方法将公共场所异常声音信号分解为一系列乘积函数PF分量,每阶分量分别包含异常声音信号的某个频率段信息;再然后,用各阶PF分量与异常声音信号的能量比作为其特征向量,判断特征向量是否有效;最后,将有效的特征向量输入支持向量机SVM进行识别。所述的CELMDAN方法是基于局部均值分解LMD方法,并对该方法的端点效应、分解耗时及模态混叠问题进行改进;所述的CELMDAN方法的核心是CELMDAN方法的模型的建立。所述的局部均值分解LMD的端点效应的问题改进是采用边界处理方法,估计信号两侧极值信息,缓解端点效应。所述的分解耗时的问题改进是采用线性插值过程代替局部均值分解LMD的滑动平均过程,并且将乘积函数PF分量作为反馈评估,对乘积函数PF分量阶数及筛选次数进行约束,减小分解耗时。所述的模态混叠问题的改进是采用自适应加噪方式,通过噪声缓解模态混叠,降低重构误差。具体地,所述的边界处理包括左边界处理和右边界处理,且左边界处理与右边界处理方式相同,下面以左边界处理为例进行详细介绍。左边界处理方法如下:首先将信号的左端点值记为Y1,连接信号第一、二个极大值点构成的直线方程为y(t)=k1(t-1)+b1,连接信号第一、二个极小值点构成的直线方程为y(t)=k2(t-1)+b2,式中,k为连接两个极值点的直线的斜率,b为直线与y轴的交点。左边界极大值记为Zmax,左边界极小值记为Zmin;具体处理方法如下:步骤2.1:若满足表达式b2≤Y1≤b1,则Zmax=b1且Zmin=b2;步骤2.2:若满足表达式b1<Y1≤(b1+b2)/2+(b1-b2)=(3b1-b2)/2,则Zmax=Y1且Zmin=b2;否则若(3b2-b1)/2=(b1+b2)/2-(b1-b2)≤Y1<b2,则Zmax=b1且Zmin=Y1;步骤2.3:若满足表达式Y1>(3b1-b2)/2,则Zmax=Y1,以第一个极小值点作直线y(t)=k*(t-1)+b*,该直线平行于过左端点和第一个极大值点的直线,且Zmin=b*;否则若Y1<(3b2-b1)/2,则Zmin=Y1,以第一个极大值点作直线y(t)=k*(t-1)+b*,该直线平行于过左端点和第一个极小值点的直线,且Zmax=b*。具体地,所述的采用线性插值过程代替局部均值分解LMD的滑动平均过程,包括:首先对信号x(t)的极大值点、极小值点分别进行线性插值,得到相应的上包络线A(t)、下包络线B(t);然后根据式计算局部均值曲线m11(t)和包络估计曲线a11(t)。具体地,所述的乘积函数PF分量作为反馈评估,对乘积函数PF分量阶数及筛选次数进行约束的具体操作为:首先,采用方差比率Ratio=σ/σ0来反映LMD分解效果,各参数定义如下:式中,x(n)为原始信号,N为原始信号长度,为原始信号x(t)的数学期望,r(t)为最终余项;然后,对LMD的筛选次数限制K进行优化设置,K的值需要事先作一系列先验分解实验,并根据实验结果的统计分析进行设置。具体地,所述的自适应加噪方式的特点是分解嵌套思想,具体的分解步骤如下:第1轮加噪:分别将一定信噪比的白噪声wi(t)叠加到原始信号x(t)上,i=1,2,…,I,其中I为加噪次数;然后通过LMD分解得到混合信号的第一阶分量,再取平均值作为本方法的第一阶PF分量:其中,ε为加噪幅度,L1[A(t)]表示LMD对信号A(t)分解得到的第1阶分量,此时的余项为:r1(t)=x(t)-PF1第2轮加噪:分别将白噪声wi(t)的第一阶PF分量叠加到r1(t)上,再用LMD分解得到混合信号的第一阶分量,取平均作为本方法的第二阶PF分量:其中,ε为加噪幅度,L1[A(t)]表示LMD对信号A(t)分解得到的第1阶分量,此时的余项为:r2(t)=r1(t)-PF2第m轮加噪:分别将白噪声wi(t)的第(m-1)阶PF分量叠加到余项rm-1(t)上,若白噪声的PF分量阶数不够,则该轮不加噪;然后通过LMD分解得到混合信号的第一阶分量,再取平均值作为本方法的第m阶PF分量,即:此时得到的余项为:rm(t)=rm-1(t)-PFm重复执行M轮加噪,直至满足停止条件,即余项的极值点数达到下限或者所得PF分量的阶数达到上限,最终的余项为rM(t)=rM-1(t)-PFM。具体地,所述的CELMDAN方法的模型为:上式从理论上证明CELMDAN方法是完备的,即分解所得分量重构原信号的误差为零;其中:x(t本文档来自技高网
...
公共场所异常声音特征提取方法

【技术保护点】
公共场所异常声音特征提取方法,其特征在于:首先,采集公共场所异常声音信号,完成声音信号的预处理;然后,采用自适应噪声的完备总体局部均值分解CELMDAN方法将公共场所异常声音信号分解为一系列乘积函数PF分量,每阶分量分别包含异常声音信号的某个频率段信息;再然后,用各阶PF分量与异常声音信号的能量比作为其特征向量,判断特征向量是否有效;最后,将有效的特征向量输入支持向量机SVM进行识别;所述的CELMDAN方法是基于局部均值分解LMD方法,并对该方法的端点效应、分解耗时及模态混叠问题进行改进而获得;所述的CELMDAN方法的核心是CELMDAN方法的模型的建立;所述的端点效应的问题改进是采用边界处理方法,估计信号两侧极值信息,缓解端点效应;所述的分解耗时的问题改进是采用线性插值过程代替局部均值分解LMD的滑动平均过程,并且将乘积函数PF分量作为反馈评估,对乘积函数PF分量阶数及筛选次数进行约束,减小分解耗时;所述的模态混叠问题的改进是采用自适应加噪方式,通过噪声缓解模态混叠,降低重构误差。

【技术特征摘要】
1.公共场所异常声音特征提取方法,其特征在于:首先,采集公共场所异常声音信号,完成声音信号的预处理;然后,采用自适应噪声的完备总体局部均值分解CELMDAN方法将公共场所异常声音信号分解为一系列乘积函数PF分量,每阶分量分别包含异常声音信号的某个频率段信息;再然后,用各阶PF分量与异常声音信号的能量比作为其特征向量,判断特征向量是否有效;最后,将有效的特征向量输入支持向量机SVM进行识别;所述的CELMDAN方法是基于局部均值分解LMD方法,并对该方法的端点效应、分解耗时及模态混叠问题进行改进而获得;所述的CELMDAN方法的核心是CELMDAN方法的模型的建立;所述的端点效应的问题改进是采用边界处理方法,估计信号两侧极值信息,缓解端点效应;所述的分解耗时的问题改进是采用线性插值过程代替局部均值分解LMD的滑动平均过程,并且将乘积函数PF分量作为反馈评估,对乘积函数PF分量阶数及筛选次数进行约束,减小分解耗时;所述的模态混叠问题的改进是采用自适应加噪方式,通过噪声缓解模态混叠,降低重构误差。2.根据权利要求1所述的公共场所异常声音特征提取方法,其特征在于,所述的边界处理包括左边界处理和右边界处理;左边界处理方法如下:首先将信号的左端点值记为Y1,由信号第一、二个极大值点构成的直线方程为y(t)=k1(t-1)+b1,由信号第一、二个极小值点构成的直线方程为y(t)=k2(t-1)+b2,式中,k为连接两个极值点的直线的斜率,b为直线与y轴的交点,补充过后左边界极大值Zmax,左边界极小值依次记为Zmin;具体处理方法如下:步骤2.1:若满足表达式b2≤Y1≤b1,则Zmax=b1且Zmin=b2;步骤2.2:若满足表达式b1<Y1≤(b1+b2)/2+(b1-b2)=(3b1-b2)/2,则Zmax=Y1且Zmin=b2;否则若(3b2-b1)/2=(b1+b2)/2-(b1-b2)≤Y1<b2,则Zmax=b1且Zmin=Y1;步骤2.3:若满足表达式Y1>(3b1-b2)/2,则Zmax=Y1,以第一个极小值点作直线y(t)=k*(t-1)+b*,该直线平行于过左端点和第一个极大值点的直线,且Zmin=b*;否则若Y1<(3b2-b1)/2,则Zmin=Y1,以第一个极大值点作直线y(t)=k*(t-1)+b*,该直线平行于过左端点和第一个极小值点的直线,且Zmax=b*p;对于右边的处理方式与左边界处理方式相同。3.根据权利要求1所述的公共场所异常声音特征提取方法,其特征在于,所述的采用线性插值过程代替局部均值分解LMD的滑动平均过程,包括:首先对信号x(t)的极大值点、极小值点分别进行线性插值,得到相应的上包络线A(t)、下包络线B(t);然后根据式m11(t)=A(t)+B(t)2a11(t)=|A(t)-B(t)|2]]>计算局部均值曲线m11(t)和包络估计曲线a11(t)。4.根据权利要求1所述的公共场所异常声音特征提取方法,其特征在于,所述的对乘积函数PF分量阶数及筛选次数进行约束的具体操作为:首先,采用方差比率Ratio=σ/σ0来反映LMD分解效果,各参数定义如下:σ=1NΣn=1N[x(n)-r(n)]2σ0=1NΣn=...

【专利技术属性】
技术研发人员:李伟红
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1