一种基于MFCC和人工神经网络的水下机动小目标识别方法技术

技术编号:16606483 阅读:40 留言:0更新日期:2017-11-22 16:29
一种基于MFCC和人工神经网络的水下机动小目标识别方法,所述方法包括:对待识别目标的原始声音信号s(n)进行预处理,得到每个语音帧的时域信号x(n);提取时域信号x(n)的MFCC特征量,利用MFCC特征量进行二次特征提取获取差分MFCC特征量,将MFCC特征量、差分MFCC特征量和x(n)的峰值频率进行结合,形成MFCC混合特征量,将所述MFCC混合特征向量输入到训练好的人工神经网络分类器进行识别,输出识别的类型。本发明专利技术的方法提取的MFCC混合特征模仿人的听觉特性,将人耳出色的声音信号处理能力有效地应用于水下机动小目标分类;同时利用了信号的帧间特征,减小了环境噪声产生的误差,提高了水下机动小目标的识别率。

A method of underwater maneuvering small target recognition based on MFCC and artificial neural network

A target recognition method and MFCC artificial neural network based on the underwater, the method includes: the original voice signal to identify the target of S (n) pretreatment, time domain signal x of each speech frame (n); extraction time domain signal x (n) MFCC features, the use of MFCC features the amount of two times to obtain the differential feature extraction of MFCC features, MFCC features, MFCC features and differential x (n) of the peak frequency with formation of MFCC mixed features, the MFCC mixed feature vector is input to the artificial neural network classifier is trained to recognize, identify the type of output. MFCC mixed feature extraction method of the invention of the imitation of the characteristics of human hearing, the human ear excellent sound signal processing capability is effectively applied to underwater target classification; at the same time the characteristics of the signal frame, reduces the error of environment noise, improves the recognition rate under water target.

【技术实现步骤摘要】
一种基于MFCC和人工神经网络的水下机动小目标识别方法
本专利技术涉及水下小目标的识别领域,具体涉及一种基于MFCC和人工神经网络的水下机动小目标识别方法。
技术介绍
冷战时期,各国处在战争警戒状态,海上探测和防御的对象主要是敌对国家的舰船和潜艇等大型目标。随着冷战的结束,特别是前苏联解体后,水下武器装备小型化的迅速发展,蛙人、水下运载器及水下机器人等技术装备的日益成熟,这类目标具有隐蔽性好,破坏力强等明显“非对称”优势的攻击方式,已成为恐怖主义分子进行恐怖活动的重要方式。近年来,国内外等对蛙人等水下小目标的探测及识别进行了相关研究,但针对水下机动小目标的分类识别较少。在主动声信号识别领域,装备美国海军的SQS-26声呐具有主动目标分类功能。另外,很多国外海军的鱼雷自导系统,现在也已经具备了识别船舶要害部位的能力。文献[1](吴国,李靖,李训浩,陈耀明,袁毅.舰船噪声识别(III)—双重谱和平均功率谱的特征提取和模板图.声学学报,1999,24(2):191-196页;吴国清,李靖,李训法,陈耀明,袁毅.舰船噪声识别(IV)—模糊神经网络.声学学报,1999,24(3):275-280页)等人对舰船的辐射噪声进行了大量的研究,提取了舰船辐射噪声的众多特征,并利用统计模式识别和模糊神经网络相结合的方式对舰船噪声进行识别。文献[2](LIQihu,WANGJinlin,WEIWei.Anapplicationofexpertsysteminrecognitionofradiatednoiseofunder-watertarget.Beijing:InstituteofAcoustics,ChineseAcademyofSciences,1989.404-408)研制了水声目标专家识别系统,大多数情况下,当信噪比不低于3dB时,信号的识别率超过了75%。在水声信号处理领域,目前常用的方法是将时域信号变换到时频联合域,通过时频联合分布揭示信号的非平稳性及频率随时间的变化特征。文献[3](石超雄.基于提升小波变换的MFCC在目标识别中的应用[J].声学技术,2014,33(4):372-375.)提出了使用提升小波变换的MFCC的方法,对水下被动声纳目标分类和识别。其仿真实验表明,提升小波变换方法提取MFCC具有识别率较高、对噪声鲁棒性较好的优点。文献[4](竺乐庆,张真.基于MFCC和GMM的昆虫声音自动识别[J].昆虫学报,2012,55(4):466-471.)将MFCC和高斯混合模型(GMM)应用于森林中昆虫的识别,在包含58种昆虫声音的样本库中进行了评估,取得了较高的正确识别率和较理想的时间性能。这些研究表明基于MFCC的方法可以用于复杂情况下的声音信号特征提取识别。目前基于MFCC对水下目标的识别方法普遍抗噪性低,多应用于信噪比较高的情况,因此对于目前信噪比较低、多种目标共存的复杂水下环境的小目标识别率较低。由于人工神经网络具有很强的学习能力、自适应能力、鲁棒性和容错能力,对信息的处理过程更接近人类大脑思维活动,可以代替复杂耗时的传统算法。同时利用神经网络的高度并行运算能力,难以用其它数学计算基数实现的最优信号处理算法可以实时是吸纳。由于人工神经网络的上述特点,在水声目标识别领域人工神经网络逐渐得到了水声学者的关注和应用。尤其适合于像水下机动小目标这类与人的感知有关的信息处理。它可以通过从样本中学习,实现网络的自我组织和调整。提取信号的特征之后,将要对信号展开识别工作。由于水声信号具有很强的不平稳性,加上水下环境的复杂性;另外水声信号的先验数学知识很难掌握,在水声信号处理领域,很难对其进行准确描述。所以水声信号的分类问题是一个非线性问题,非常复杂。
技术实现思路
本专利技术的目的在于克服目前MFCC方法用于信噪比较低、多种目标共存的复杂水下环境的小目标识别存在的识别率较低的问题,提出了一种基于MFCC和人工神经网络的水下机动小目标识别方法,该方法提取目标音频信号的混合MFCC特征量,包括:差分MFCC特征和MFCC特征,然后利用训练出的BP人工神经网络对混合MFCC特征量进行识别,从而实现对目标的分类,实验表明本专利技术的方具有较高的目标识别率。为了实现上述目的,本专利技术提出了基于MFCC和神经网络的水下小目标识别方法,以MFCC和傅里叶变换为基础构建混合特征向量,然后使用神经网络分类器对目标进行识别;所述方法包括:对待识别目标的原始声音信号s(n)进行预处理,得到每个语音帧的时域信号x(n);提取时域信号x(n)的2K个MFCC特征量,利用2K个MFCC特征量获取2K个差分MFCC特征量,将偶数位置的MFCC特征量、偶数位置的差分MFCC特征量和峰值频率f进行结合,形成MFCC混合特征量,将所述MFCC混合特征向量输入到训练好的人工神经网络分类器进行识别,输出识别的类型。上述技术方案中,所述方法具体包括:步骤1)对待识别目标的原始声音信号s(n)进行预处理,得到每个语音帧的时域信号x(n);步骤2)计算时域信号x(n)的2K个MFCC系数,并将偶数位置的MFCC系数形成MFCC特征量;步骤3)对2K个MFCC系数进行二次特征提取,计算2K个差分MFCC系数,并将偶数位置的MFCC系数形成差分MFCC特征量;步骤4)计算时域信号x(n)的峰值频率f;步骤5)将MFCC特征量、差分MFCC特征量和峰值频率f进行结合,形成MFCC混合特征量;步骤6)将所述MFCC混合特征向量输入到训练好的人工神经网络分类器进行识别,直至识别成功,输出识别的类型。上述技术方案中,所述步骤2)具体包括:步骤201)将时域信号x(n)经过离散傅里叶变换后得到线性频谱X(k):其中,N为表示傅里叶变换的点数;步骤202)计算线性频谱X(k)的能量谱,通过2K个带通滤波器对能量谱进行带通滤波;步骤203)计算每个带通滤波器组输出的对数能量为:步骤204)对输出的对数能量S(m)进行离散余弦变换得到MFCC系数:步骤205)时域信号x(n)的MFCC特征量为:[C(2),C(4),...C(2K)]。上述技术方案中,所述步骤3)的具体实现过程为:差分MFCC系数的计算方法为:其中,k为常数,k=2;差分MFCC特征量为:[d(2),d(4),...d(2K)]。上述技术方案中,所述步骤5)中的MFCC混合特征量为:[C(2),C(4),...,C(2K),d(2),d(4),...,d(2K),f]其维数为2K+1。上述技术方案中,在所述步骤6)之前还包括:训练人工神经网络分类器;具体包括:步骤S1)将训练样本进行分类;步骤S2)对训练样本进行预处理形成时域信号;步骤S3)将每个训练样本时域信号作为x(t),按照步骤1)、步骤2)、步骤3)、步骤4)和步骤5)构建每个训练样本的时域信号的MFCC混合特征向量;步骤S4)将所有训练样本的MFCC混合特征向量作为人工神经网络的输入,训练出人工神经网络分类器。上述技术方案中,所述人工神经网络分类器的输入层的节点数为2K+1;隐含层节点数为2(2K+1)+1;输出层的节点为识别的类型数。本专利技术的优点在于:1、本专利技术的方法提取的MFCC混合特征模仿人的听觉特性,将人耳出色的声音信号处理能力有效的本文档来自技高网
...
一种基于MFCC和人工神经网络的水下机动小目标识别方法

【技术保护点】
一种基于MFCC和人工神经网络的水下机动小目标识别方法,所述方法包括:对待识别目标的原始声音信号s(n)进行预处理,得到每个语音帧的时域信号x(n);提取时域信号x(n)的MFCC特征量,利用MFCC特征量进行二次特征提取获取差分MFCC特征量,将MFCC特征量、差分MFCC特征量和x(n)的峰值频率进行结合,形成MFCC混合特征量,将所述MFCC混合特征向量输入到训练好的人工神经网络分类器进行识别,输出识别的类型。

【技术特征摘要】
1.一种基于MFCC和人工神经网络的水下机动小目标识别方法,所述方法包括:对待识别目标的原始声音信号s(n)进行预处理,得到每个语音帧的时域信号x(n);提取时域信号x(n)的MFCC特征量,利用MFCC特征量进行二次特征提取获取差分MFCC特征量,将MFCC特征量、差分MFCC特征量和x(n)的峰值频率进行结合,形成MFCC混合特征量,将所述MFCC混合特征向量输入到训练好的人工神经网络分类器进行识别,输出识别的类型。2.根据权利要求1所述的基于MFCC和人工神经网络的水下机动小目标识别方法,其特征在于,所述方法具体包括:步骤1)对待识别目标的原始声音信号s(n)进行预处理,得到每个语音帧的时域信号x(n);步骤2)计算时域信号x(n)的2K个MFCC系数,并将偶数位置的MFCC系数形成MFCC特征量;步骤3)对2K个MFCC系数进行二次特征提取,计算2K个差分MFCC系数,并将偶数位置的MFCC系数形成差分MFCC特征量;步骤4)计算时域信号x(n)的峰值频率f;步骤5)将MFCC特征量、差分MFCC特征量和峰值频率f进行结合,形成MFCC混合特征量;步骤6)将所述MFCC混合特征向量输入到训练好的人工神经网络分类器进行识别,直至识别成功,输出识别的类型。3.根据权利要求2所述的基于MFCC和人工神经网络的水下机动小目标识别方法,其特征在于,所述步骤2)具体包括:步骤201)将时域信号x(n)经过离散傅里叶变换后得到线性频谱X(k):其中,N为表示傅里叶变换的点数;步骤202)计算线性频谱X(k)的能量谱,通过2K个带通滤波器对能量谱进行带通滤波;步骤203)计算每个带通滤波器组输出的对数能量为:

【专利技术属性】
技术研发人员:许枫宋宏健闫路
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1