一种基于数据增强和残差CNN的水声目标识别方法技术

技术编号：35854441 阅读：19 留言：0更新日期：2022-12-07 10:40

本发明专利技术涉及一种基于数据增强和残差CNN的水声目标识别方法，主要包括提取水声目标MFCC特征、数据增强处理和ResNet18模型识别，充分发挥了数据增强技术的数据扩充优势和残差CNN模型的深层特征挖掘能力，有效识别水声目标。本研究采用DCGAN模型，DCGAN具有优异的生成图像架构，DCGAN判别器通过引入CNN模型可提取到更深层的图片特征，在图像生成和分类上具有较大的优势。分类模型采用具有残差连接的ResNet18模型，本研究在ResNet18模型的基础上，去掉其中的池化层，保留更多水声特征信息，调节网络模型的尺寸，从而与本研究输入的特征图像相适应。本研究在水声目标样本数据相对稀缺的场景中，利用数据增强技术和残差CNN模型，实现了水声目标的有效识别。实现了水声目标的有效识别。实现了水声目标的有效识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于数据增强和残差CNN的水声目标识别方法

[0001]本专利技术属于数字信号处理、机器学习和水声测量等领域，涉及一种基于数据增强和残差CNN的水声目标识别方法，利用数据增强技术和残差CNN模型，实现在水声目标样本数据相对稀缺的场景下的声信号识别。

技术介绍

[0002]在机器学习技术迅速发展的背景下，由于神经网络等数据驱动模型可挖掘不同目标声信号的深层特征，且在很大程度上可减少噪声的影响，有效实现分类决策的自主化与智能化，因此，在声音信号处理领域，机器学习方法得到了广泛的研究和应用，但水声目标样本数据相对稀缺，使得机器学习在实际水声识别中的应用受到限制。在2013年，Kamal等将深度置信网络(Deep Brief Network，DBN)模型应用于水声信号被动目标识别任务中，实现了无标签的水下目标声信号识别(S.Kamal,S.K.Mohammed,P.R.S.Pillai,M.H.Supriya,“Deep learning architectures for underwater target recognition,”.Sympol 2013,pp.48
‑
54.)。在2014年，Shamir等人在提取鲸鱼声学特征的基础上，利用机器学习方法实现了不同种类鲸鱼的自动识别(L.Shamir,C.Yerby,R.Simpson,A.M.von Benda
‑
Beckmann,P.Tyack,F.Samarra,et al,“Classification of large a...

【技术保护点】

【技术特征摘要】
1.一种基于数据增强和残差CNN的水声目标识别方法，其特征在于步骤如下：步骤1：提取各个类别水声目标信号的MFCC特征；步骤2：将每5个连续帧MFCC特征并联拼接生成一个二维矩阵，此二维矩阵可绘制为彩图，以此作为单个样本的输入特征图像，即初始特征图像，各个类别均选取其中3/4的图片样本用于模型的训练和验证，剩余的1/4用于模型的测试；步骤3：采用传统数据增强技术，设置多个图像对比度范围，得到不同对比度范围的生成图，并设置图像水平和垂直方向的缩放范围和平移范围。步骤4：将特征图像输入深度卷积生成对抗网络DCGAN模型训练，DCGAN模型包括鉴别器和生成器，两个网络通过对抗共同进步，以达到样本生成的最佳效果，从而输出得到相应的生成特征图像；步骤5：在ResNet18模型的基础上搭建残差CNN分类模型，去掉其中的池化层，并调节其输入层、全连接层和输出层换为适合识别任务的尺寸，将该残差CNN模型作为识别任务的分类模型，并将特征图像转化为与ResNet18模型中的卷积层尺寸相匹配的尺寸；步骤6：将初始特征图像、步骤3经过调节对比度处理和步骤4深度卷积生成对抗网络DCGAN模型的多个生成特征图像均作为残差CNN模型的输入特征，对残差CNN模型进行训练，并对测试数据以及数据识别。2.根据权利要求1所述基于数据增强和残差CNN的水声目标识别方法，其特征在于：所述提取水声目标MFCC特征：对每帧信号做FFT得到频谱，将频谱通过一组三角带通滤波器滤波得到Mel滤波，计算每个滤波器输出的对数能量，并计算其离散余弦变换，求出L阶的MFCC，计算L个MFCC倒谱差分参数，将MFCC、一阶和二阶的倒谱差分参数三部分参数组合作为信号的特征向量。3.根据权利要求1所述基于数据...

【专利技术属性】
技术研发人员：汪勇，姚琦海，杨益新，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人