一种基于数据增强和残差CNN的水声目标识别方法技术

技术编号:35854441 阅读:13 留言:0更新日期:2022-12-07 10:40
本发明专利技术涉及一种基于数据增强和残差CNN的水声目标识别方法,主要包括提取水声目标MFCC特征、数据增强处理和ResNet18模型识别,充分发挥了数据增强技术的数据扩充优势和残差CNN模型的深层特征挖掘能力,有效识别水声目标。本研究采用DCGAN模型,DCGAN具有优异的生成图像架构,DCGAN判别器通过引入CNN模型可提取到更深层的图片特征,在图像生成和分类上具有较大的优势。分类模型采用具有残差连接的ResNet18模型,本研究在ResNet18模型的基础上,去掉其中的池化层,保留更多水声特征信息,调节网络模型的尺寸,从而与本研究输入的特征图像相适应。本研究在水声目标样本数据相对稀缺的场景中,利用数据增强技术和残差CNN模型,实现了水声目标的有效识别。实现了水声目标的有效识别。实现了水声目标的有效识别。

【技术实现步骤摘要】
一种基于数据增强和残差CNN的水声目标识别方法


[0001]本专利技术属于数字信号处理、机器学习和水声测量等领域,涉及一种基于数据增强和残差CNN的水声目标识别方法,利用数据增强技术和残差CNN模型,实现在水声目标样本数据相对稀缺的场景下的声信号识别。

技术介绍

[0002]在机器学习技术迅速发展的背景下,由于神经网络等数据驱动模型可挖掘不同目标声信号的深层特征,且在很大程度上可减少噪声的影响,有效实现分类决策的自主化与智能化,因此,在声音信号处理领域,机器学习方法得到了广泛的研究和应用,但水声目标样本数据相对稀缺,使得机器学习在实际水声识别中的应用受到限制。在2013年,Kamal等将深度置信网络(Deep Brief Network,DBN)模型应用于水声信号被动目标识别任务中,实现了无标签的水下目标声信号识别(S.Kamal,S.K.Mohammed,P.R.S.Pillai,M.H.Supriya,“Deep learning architectures for underwater target recognition,”.Sympol 2013,pp.48

54.)。在2014年,Shamir等人在提取鲸鱼声学特征的基础上,利用机器学习方法实现了不同种类鲸鱼的自动识别(L.Shamir,C.Yerby,R.Simpson,A.M.von Benda

Beckmann,P.Tyack,F.Samarra,et al,“Classification of large acoustic datasets using machine learning and crowdsourcing:Application to whale calls,”Journal of the Acoustical Society of America,2014,vol.135No.2,pp.953

962.)。2017年,Yue等人利用SVM、DBN和CNN模型,实现了船舶目标声信号的有效识别(Hao Y,Zhang L,Wang D,et al.The Classification of Underwater Acoustic Targets Based on Deep Learning Methods.2017 2nd International Conference on Control,Automation and Artificial Intelligence.2017.)。在2020年,Yu等人搭建了多种机器学习模型,用于检测北大西洋露脊鲸的发声,结果表明CNN模型可很大程度地提高准确度(Y.Shiu,K.J.Palmer,M.A.Roch,E.Fleishman,X.Liu,E.M.Nosal,T.Helble,D.Cholewiak,D.Gillespie,and H.Klinck,“Deep neural networks for automated detection of marine mammal species,”Sci.Rep.10(1),1

12(2020).)。
[0003]随着机器学习模型层数及复杂度的增加,使得对数据量的要求越来越大,只有通过海量的有标签数据训练模型才能达到好的识别效果,而现实中,水声目标样本数据相对稀缺,使得机器学习在实际水声识别中的应用受到限制。为了增加机器学习训练所需的样本量,数据增强方法已成为最流行的技术之一(Fong,R.,&Vedaldi,A.(2019).Occlusions for effective data augmentation in image classification.)。传统数据增强技术通过添加几何变换、颜色空间变换等方法实现训练样本的扩充。但由于传统数据增强技术无法得到实质上的生成样本,且修改量较小,数据扩充后的训练性能受到限制。为避免传统数据增强技术的局限性,Goodfellow等人提出了生成对抗性网络(Generative Adversarial Network,GAN),通过生成器和鉴别器的对抗式训练,得到与真实数据分布一致的生成数据(Goodfellow I,Pouget

Abadie J,Mirza M,et al.Generative Adversarial Nets[C]//
Neural Information Processing Systems.MIT Press,2014.)。
[0004]综上所述,在水声目标样本数据匮乏的场景中,一种将声信号特征提取技术、数据增强技术和机器学习方法相结合的水声目标识别方法是必不可少的。

技术实现思路

[0005]要解决的技术问题
[0006]为了避免现有技术的不足之处,本专利技术提出一种基于数据增强和残差CNN的水声目标识别方法
[0007]技术方案
[0008]一种基于数据增强和残差CNN的水声目标识别方法,其特征在于步骤如下:
[0009]步骤1:提取各个类别水声目标信号的MFCC特征;
[0010]步骤2:将每5个连续帧MFCC特征并联拼接生成一个二维矩阵,此二维矩阵可绘制为彩图,以此作为单个样本的输入特征图像,即初始特征图像,各个类别均选取其中3/4的图片样本用于模型的训练和验证,剩余的1/4用于模型的测试;
[0011]步骤3:采用传统数据增强技术,设置多个图像对比度范围,得到不同对比度范围的生成图,并设置图像水平和垂直方向的缩放范围和平移范围。
[0012]步骤4:将特征图像输入深度卷积生成对抗网络DCGAN模型训练,DCGAN模型包括鉴别器和生成器,两个网络通过对抗共同进步,以达到样本生成的最佳效果,从而输出得到相应的生成特征图像;
[0013]步骤5:在ResNet18模型的基础上搭建残差CNN分类模型,去掉其中的池化层,并调节其输入层、全连接层和输出层换为适合识别任务的尺寸,将该残差CNN模型作为识别任务的分类模型,并将特征图像转化为与ResNet18模型中的卷积层尺寸相匹配的尺寸;
[0014]步骤6:将初始特征图像、步骤3经过调节对比度处理和步骤4深度卷积生成对抗网络DCGAN模型的多个生成特征图像均作为残差CNN模型的输入特征,对残差CNN模型进行训练,并对测试数据以及数据识别。
[0015]所述提取水声目标MFCC特征:对每帧信号做FFT得到频谱,将频谱通过一组三角带通滤波器滤波得到Mel滤波,计算每个滤波器输出的对数能量,并计算其离散余弦变换,求出L阶的MFCC,计算L个MFCC倒谱差分参数,将MFCC、一阶和二阶的倒谱差分参数三部分参数组合作为信号的特征向量。
[0016]所述对初始特征图像采用传统数据增强技术:调节图像对比度范围:0.1~0.9,0.2~0.8和0.3~0.7,原始信号图可通过调节对比度得到3个生成图;设置图像水平和垂直方向的缩放范围均为0.9本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据增强和残差CNN的水声目标识别方法,其特征在于步骤如下:步骤1:提取各个类别水声目标信号的MFCC特征;步骤2:将每5个连续帧MFCC特征并联拼接生成一个二维矩阵,此二维矩阵可绘制为彩图,以此作为单个样本的输入特征图像,即初始特征图像,各个类别均选取其中3/4的图片样本用于模型的训练和验证,剩余的1/4用于模型的测试;步骤3:采用传统数据增强技术,设置多个图像对比度范围,得到不同对比度范围的生成图,并设置图像水平和垂直方向的缩放范围和平移范围。步骤4:将特征图像输入深度卷积生成对抗网络DCGAN模型训练,DCGAN模型包括鉴别器和生成器,两个网络通过对抗共同进步,以达到样本生成的最佳效果,从而输出得到相应的生成特征图像;步骤5:在ResNet18模型的基础上搭建残差CNN分类模型,去掉其中的池化层,并调节其输入层、全连接层和输出层换为适合识别任务的尺寸,将该残差CNN模型作为识别任务的分类模型,并将特征图像转化为与ResNet18模型中的卷积层尺寸相匹配的尺寸;步骤6:将初始特征图像、步骤3经过调节对比度处理和步骤4深度卷积生成对抗网络DCGAN模型的多个生成特征图像均作为残差CNN模型的输入特征,对残差CNN模型进行训练,并对测试数据以及数据识别。2.根据权利要求1所述基于数据增强和残差CNN的水声目标识别方法,其特征在于:所述提取水声目标MFCC特征:对每帧信号做FFT得到频谱,将频谱通过一组三角带通滤波器滤波得到Mel滤波,计算每个滤波器输出的对数能量,并计算其离散余弦变换,求出L阶的MFCC,计算L个MFCC倒谱差分参数,将MFCC、一阶和二阶的倒谱差分参数三部分参数组合作为信号的特征向量。3.根据权利要求1所述基于数据...

【专利技术属性】
技术研发人员:汪勇姚琦海杨益新
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1