一种基于数据增强和残差CNN的水声目标识别方法技术

技术编号:35854441 阅读:103 留言:0更新日期:2022-12-07 10:40
本发明专利技术涉及一种基于数据增强和残差CNN的水声目标识别方法,主要包括提取水声目标MFCC特征、数据增强处理和ResNet18模型识别,充分发挥了数据增强技术的数据扩充优势和残差CNN模型的深层特征挖掘能力,有效识别水声目标。本研究采用DCGAN模型,DCGAN具有优异的生成图像架构,DCGAN判别器通过引入CNN模型可提取到更深层的图片特征,在图像生成和分类上具有较大的优势。分类模型采用具有残差连接的ResNet18模型,本研究在ResNet18模型的基础上,去掉其中的池化层,保留更多水声特征信息,调节网络模型的尺寸,从而与本研究输入的特征图像相适应。本研究在水声目标样本数据相对稀缺的场景中,利用数据增强技术和残差CNN模型,实现了水声目标的有效识别。实现了水声目标的有效识别。实现了水声目标的有效识别。

【技术实现步骤摘要】
一种基于数据增强和残差CNN的水声目标识别方法


[0001]本专利技术属于数字信号处理、机器学习和水声测量等领域,涉及一种基于数据增强和残差CNN的水声目标识别方法,利用数据增强技术和残差CNN模型,实现在水声目标样本数据相对稀缺的场景下的声信号识别。

技术介绍

[0002]在机器学习技术迅速发展的背景下,由于神经网络等数据驱动模型可挖掘不同目标声信号的深层特征,且在很大程度上可减少噪声的影响,有效实现分类决策的自主化与智能化,因此,在声音信号处理领域,机器学习方法得到了广泛的研究和应用,但水声目标样本数据相对稀缺,使得机器学习在实际水声识别中的应用受到限制。在2013年,Kamal等将深度置信网络(Deep Brief Network,DBN)模型应用于水声信号被动目标识别任务中,实现了无标签的水下目标声信号识别(S.Kamal,S.K.Mohammed,P.R.S.Pillai,M.H.Supriya,“Deep learning architectures for underwater target recognition,”.Sympo本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于数据增强和残差CNN的水声目标识别方法,其特征在于步骤如下:步骤1:提取各个类别水声目标信号的MFCC特征;步骤2:将每5个连续帧MFCC特征并联拼接生成一个二维矩阵,此二维矩阵可绘制为彩图,以此作为单个样本的输入特征图像,即初始特征图像,各个类别均选取其中3/4的图片样本用于模型的训练和验证,剩余的1/4用于模型的测试;步骤3:采用传统数据增强技术,设置多个图像对比度范围,得到不同对比度范围的生成图,并设置图像水平和垂直方向的缩放范围和平移范围。步骤4:将特征图像输入深度卷积生成对抗网络DCGAN模型训练,DCGAN模型包括鉴别器和生成器,两个网络通过对抗共同进步,以达到样本生成的最佳效果,从而输出得到相应的生成特征图像;步骤5:在ResNet18模型的基础上搭建残差CNN分类模型,去掉其中的池化层,并调节其输入层、全连接层和输出层换为适合识别任务的尺寸,将该残差CNN模型作为识别任务的分类模型,并将特征图像转化为与ResNet18模型中的卷积层尺寸相匹配的尺寸;步骤6:将初始特征图像、步骤3经过调节对比度处理和步骤4深度卷积生成对抗网络DCGAN模型的多个生成特征图像均作为残差CNN模型的输入特征,对残差CNN模型进行训练,并对测试数据以及数据识别。2.根据权利要求1所述基于数据增强和残差CNN的水声目标识别方法,其特征在于:所述提取水声目标MFCC特征:对每帧信号做FFT得到频谱,将频谱通过一组三角带通滤波器滤波得到Mel滤波,计算每个滤波器输出的对数能量,并计算其离散余弦变换,求出L阶的MFCC,计算L个MFCC倒谱差分参数,将MFCC、一阶和二阶的倒谱差分参数三部分参数组合作为信号的特征向量。3.根据权利要求1所述基于数据...

【专利技术属性】
技术研发人员:汪勇姚琦海杨益新
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1