当前位置: 首页 > 专利查询>重庆大学专利>正文

一种公共场所异常声音特征提取及识别方法技术

技术编号:14186116 阅读:112 留言:0更新日期:2016-12-14 21:16
本发明专利技术涉及一种公共场所异常声音的提取及识别方法,对极点对称模态分解(ESMD)进行改进,简称D‑ESMD,其特点是:在公共场所异常声音中加入随机T分布序列信号,减小公共场所背景噪声对异常声音特征提取的影响;针对原始ESMD在分解异常声音时,分解效果欠佳的问题,提出对称中点插值替代极值中点奇偶插值方法,提高异常声音分解效率与识别率;针对原始ESMD在有效分解模态选择上的缺陷,提出基于排列熵算法对ESMD分解得到的模态进行复杂性检测,自适应得到异常声音有效模态分量。利用本发明专利技术可以充分描述异常声音的特征,并得到较好的分类识别结果,更能够准确提取异常声音的特征,并且对环境背景噪声具有较好的鲁棒性。

Abnormal sound feature extraction and recognition method in public place

Extraction and identification of the invention relates to a method for abnormal sound in public places, decomposition of the pole symmetric mode (ESMD) was improved, referred to as D ESMD, which is characterized in that the random distribution of T sequence signal in the abnormal sound in public places, public places to reduce the influence of background noise on the abnormal sound feature extraction; for the original ESMD in the decomposition of abnormal sound, decomposition of poor results, proposed Symmetric Interpolation instead of extremum point parity interpolation method, decomposition efficiency and improved the recognition rate of abnormal sound; for the original ESMD in the effective decomposition of defect mode choice, the complexity of detection modal permutation entropy algorithm of ESMD decomposition based on adaptive abnormal noise effectively modal component. The invention can fully describe the characteristics of abnormal sound, and obtain better classification and recognition results, and can accurately extract the characteristics of abnormal sound, and has better robustness to the environmental background noise.

【技术实现步骤摘要】

本专利技术属于音频信号特征提取及模式识别
,尤其涉及一种公共场所异常声音特征提取及识别方法
技术介绍
公共场所如广场、公共汽车站、地铁等具有人流量大、地域广等特点,且公共场所的安全防范一直受到各国政府和人民的广泛关注。目前以视频监控为主的监控技术为公共场所的安全防范起到了积极的作用,然而视频监控技术存在监控死角、阴雨天监控模糊等问题。众所周知,在异常事件发生时常常伴随着尖叫声、枪声、玻璃破碎声、爆炸声等异常声音,因此音频监控与视频监控的协作运行已经成为公共场所安全监控领域的发展方向。目前,现有的音频监控系统仅包含简单的声音采集、传输等,缺乏对异常声音的有效识别,原因是音频监控核心理论及技术没有得到突破。公共场所异常声音识别技术为音频监控系统的核心技术。因此,对该技术的研究具有重要的社会意义以及研究价值。目前对于极点对称模态分解(Extreme-point Symmetric Mode Decomposition,ESMD)方法提取公共场所异常声音特征存在问题:①公共场所异常声音由两部分组成:异常声音信号与背景噪声信号。背景噪声信号会遮挡异常声音的局部特征,采用ESMD对公共场所异常声音进行分解,得到的模态分量必然包含背景噪声分量,导致异常声音特征产生偏差。②ESMD在分解信号时,根据极值中点构造1条、2条、3条或者等多的插值曲线提高分解效果,即ESMD_I、ESMD_II、ESMD_III方法。由于插值方式对模态分解的效果影响很大,通过比较上述三种插值方式发现,随着插值线的增加,模态数目会减少,对称度会降低,振幅变化会增强,分解效率会提高。③ESMD分解具有背景噪声的公共场所异常声音时,是利用极值点剩余个数作为分解模态终止的判定条件,这会使得被分解的低频的噪声保留下来,得到不属于异常声音的伪特征分量。④ESMD方法分解公共场所异常声音信号时,设定筛选次数K在区间[Kmin,Kmax]内变化,然后利用不同的筛选次数重复分解异常声音信号,最后采用最小二乘法原理计算出最佳筛选次数,导致ESMD分解异常声音信号耗时长。综上所述,ESMD分解技术有一定的改进空间。
技术实现思路
针对以上现有技术的不足,本专利技术提出基于改进的ESMD(D-ESMD)分解技术的公共场所异常声音特征提取及识别方法,通过对ESMD的输入信号加噪,改进内部的插值方法、分解模态终止的判定条件及模态分量筛选次数,得到公共场所异常声音在不同尺度下的特征。一种公共场所异常声音特征提取及识别方法,具体实现步骤如下:步骤1:输入公共场所待识别异常声音并进行预处理。步骤2:采用改进的极点对称模态D-ESMD分解方法将待识别异常声音信号进行分解,得到各阶模态分量,每阶模态分量分别包含异常声音信号在不同频率段的特征。步骤3:计算步骤2中得到的各阶模态分量相对于原始异常声音信号的能量比,并组合成向量形式进行归一化处理,作为待识别异常声音信号的特征向量。步骤4:判断特征向量是否有效;若无效,跳转到步骤3;若有效,执行步骤5。步骤5:公共场所待识别异常声音的识别过程:首先,在已经建立的异常声音库中随机选取每一类并且一定数量的训练样本,通过步骤2和步骤3求取其训练样本的特征向量并建立SVM分类模型;然后,利用建立的SVM分类模型对待识别异常声音的特征向量进行分类,得到分类识别结果。所述的D-ESMD分解方法是在极点对称模态ESMD分解方法基础上,添加随机T分布噪声序列于公共场所待识别异常声音当中,采用对称中点插值方法替代ESMD的极值中点奇偶插值方法,对分解的模态分量计算排列熵值,并且改进模态分量筛选次数,进而完成各模态的复杂性检测,自适应得到异常声音有效模态分量。所述的异常声音库中包括爆炸声、尖叫声、枪声、玻璃破碎声。具体地,所述的D-ESMD分解方法的具体过程为:步骤2.1确定添加T分布随机噪声次数N;步骤2.2假设待识别异常声音信号为x,添加随机的T分布序列于待识别声音信号x中,得到加噪的异常声音信号Xi;步骤2.3求取加噪过后异常声音信号Xi的极值点,连接相邻极值点,并将线段中点标记为Fi,补充左右边界点F0与Fn,采用对称中点插值方法替代ESMD的极值中点奇偶插值方法对n+1个极值中点构造插值曲线L*;步骤2.4将Xi-L*作为输入,重复上述步骤2.3直到筛选次数达到最大值,得到第一阶模态分量M1i,计算模态分量的排列熵的值;如果该信号的排列熵的值大于约定阈值θ,则认为是异常声音模态分量,否则认为是噪声分量;步骤2.5若模态分量M1i为异常声音模态分量,则将Xi-M1i作为输入信号,重复步骤2.3-步骤2.4,直到分解得到的模态分量Mni为噪声分量为止;步骤2.6若i<N,则令i=i+1,重复步骤2.2至步骤2.5,每次添加的T分布噪声信号不同,直至进行N次分解为止,对得到所有的模态分量求总体平均值,并将结果作为待分解信号的最终的模态分量Mk: M k = 1 N Σ i = 1 N M k i ]]>上式中,k是模态分量阶数,N为加噪次数。具体地,所述的对称中点插值方法具体步骤为:步骤3.1、假设输入信号为y,求取y的所有极大值点ymax与极小值点ymin;步骤3.2、连接所有相邻极值点,并求取极值中点ymean;ymean=(ymax+ymin)/2步骤3.3、求取相邻极值中点的对称中点ym,同时采用三次样条插值方法对ym进行插值,得到最终插值曲线。具体地,步骤2.4中筛选次数最优为12。具体地,排列熵的具体计算过程如下:假设一个长度为N的时间序列信号x(i),i=1,2,…,N,对其进行延迟重构,得到如下时间序列:式中,l为时间延迟,m为重构维数,对X(i)中m个元素进行升序排列,得到:Xi'={x(i+(j1-1)*l)≤x(i+(j2-1)*l)≤…≤x(i+(jm-1)*l)本文档来自技高网
...
一种公共场所异常声音特征提取及识别方法

【技术保护点】
一种公共场所异常声音特征提取及识别方法,其特征在于,包括:公共场所待识别异常声音分解、特征提取和识别;具体实现步骤如下:步骤1:输入公共场所待识别异常声音并进行预处理;步骤2:采用改进的极点对称模态分解D‑ESMD方法将待识别异常声音信号进行分解,得到各阶模态分量,每阶模态分量分别包含异常声音信号在不同频率段的特征;步骤3:计算步骤2中得到的各阶模态分量相对于原始异常声音信号的能量比,并组合成向量形式进行归一化处理,作为待识别异常声音信号的特征向量;步骤4:判断特征向量是否有效;若无效,跳转到步骤3;若有效,执行步骤5;步骤5:公共场所待识别异常声音的识别过程:首先,在已经建立的异常声音库中随机选取每一类并且一定数量的训练样本,通过步骤2和步骤3求取其训练样本的特征向量并建立SVM分类模型;然后,利用建立的SVM分类模型对待识别异常声音的特征向量进行分类,得到分类识别结果;所述的D‑ESMD分解方法是在极点对称模态ESMD分解方法基础上,添加随机T分布噪声序列于公共场所待识别异常声音当中,采用对称中点插值方法替代ESMD的极值中点奇偶插值方法,对分解的模态分量计算排列熵值,并且改进模态分量筛选次数,进而完成各模态的复杂性检测,自适应得到异常声音有效模态分量;所述的异常声音库中包括爆炸声、尖叫声、枪声、玻璃破碎声。...

【技术特征摘要】
1.一种公共场所异常声音特征提取及识别方法,其特征在于,包括:公共场所待识别异常声音分解、特征提取和识别;具体实现步骤如下:步骤1:输入公共场所待识别异常声音并进行预处理;步骤2:采用改进的极点对称模态分解D-ESMD方法将待识别异常声音信号进行分解,得到各阶模态分量,每阶模态分量分别包含异常声音信号在不同频率段的特征;步骤3:计算步骤2中得到的各阶模态分量相对于原始异常声音信号的能量比,并组合成向量形式进行归一化处理,作为待识别异常声音信号的特征向量;步骤4:判断特征向量是否有效;若无效,跳转到步骤3;若有效,执行步骤5;步骤5:公共场所待识别异常声音的识别过程:首先,在已经建立的异常声音库中随机选取每一类并且一定数量的训练样本,通过步骤2和步骤3求取其训练样本的特征向量并建立SVM分类模型;然后,利用建立的SVM分类模型对待识别异常声音的特征向量进行分类,得到分类识别结果;所述的D-ESMD分解方法是在极点对称模态ESMD分解方法基础上,添加随机T分布噪声序列于公共场所待识别异常声音当中,采用对称中点插值方法替代ESMD的极值中点奇偶插值方法,对分解的模态分量计算排列熵值,并且改进模态分量筛选次数,进而完成各模态的复杂性检测,自适应得到异常声音有效模态分量;所述的异常声音库中包括爆炸声、尖叫声、枪声、玻璃破碎声。2.根据权利要求1所述的一种公共场所异常声音特征提取及识别方法,其特征在于,所述的D-ESMD分解方法的具体过程为:步骤2.1确定添加T分布随机噪声次数N;步骤2.2假设待识别异常声音信号为x,添加随机的T分布序列于待识别声音信号x中,得到加噪的异常声音信号Xi;步骤2.3求取加噪过后异常声音信号Xi的极值点,连接相邻极值点,并将线段中点标记为Fi,补充左右边界点F0与Fn,采用对称中点插值方法替代ESMD的极值中点奇偶插值方法对n+1个极值中点构造插值曲线L*;步骤2.4将Xi-L*作为输入,重复上述步骤2.3直到筛选次数达到最大值,得到第一阶模态...

【专利技术属性】
技术研发人员:李伟红田真真龚卫国王伟冰
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1