System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于CNN-Transformer合作网络模型的水声目标识别方法技术_技高网

基于CNN-Transformer合作网络模型的水声目标识别方法技术

技术编号:41408783 阅读:4 留言:0更新日期:2024-05-20 19:35
本申请的实施例涉及水声目标识别技术领域,特别涉及一种基于CNN‑Transformer合作网络模型的水声目标识别方法,包括:对获取到的待识别水声信号的音频数据,通过梅尔滤波器组进行滤波处理,将待识别水声信号的频谱转换为梅尔频谱图;将所述梅尔频谱图输入至预训练的CNN‑Transformer合作网络模型中,获取其对待识别水声信号的水声目标识别结果,CNN‑Transformer合作网络模型由采用CNN作为网络结构的局部特征提取层、采用融合了通道注意力机制的Swin Transformer作为网络结构的全局特征提取层和分类层组成。该方法大幅提升了水声目标识别的速度、效率和精度。

【技术实现步骤摘要】

本申请的实施例涉及水声目标识别,特别涉及一种基于cnn-transformer合作网络模型的水声目标识别方法。


技术介绍

1、水声信号是目前已知的唯一能够实现水下有效传输的信息载体,基于水声信号传输和处理的声呐装备,是完成水下目标探测、识别、通信、导航和信息对抗的必备装备,也是海洋装备的重要组成部分。由于水声目标的发声机理复杂、目标类型和航行工况多样、以及海洋信道时变空变等原因,基于目标辐射噪声的水下目标识别技术一直是声呐领域中研究的重难点之一。随着水下装备降噪技术的进步、水下无人航行器的迅速发展、以及不断恶劣的水下复杂环境,人们对水声目标识别的精度有了更高的要求,所以研究更加自主、智能、高效的水声目标识别技术符合当下的需求。

2、近几年,深度学习理论广受关注,这也为水声目标识别技术提供了新的研究思路。cnn模型(convolutional neural network,卷积神经网络)已被广泛应用于水声目标识别技术,这是因为cnn模型固有的归纳偏差(如空间局部性和平移等方差)擅长捕获水声特征中的局部模式,并可从输入中提取高级特征。不过基于cnn模型的深度学习方法在捕获水声特征的全局信息方面存在一定的局限性,与cnn模型相比,基于注意力的transformer模型(转换器模型)在捕获输入数据的全局信息方面表现更好。

3、li等人将transformer模型应用于水声目标识别技术,提出了stm模型(spectrogram transformer model,频谱图转换器模型),这是一个基于transformer结构的模型,专为水声目标识别而设计,stm模型的识别准确率比传统的cnn模型有显著提升。feng等人提出了一种使用基于transformer架构的深度学习网络来识别水下声学目标。chen等人将demon(detection of envelope modulation on noise)频谱和梅尔频谱的特征结合起来,通过自动特征提取器增强demon频谱中的有用特征,并使用cnn模型提取梅尔频谱的潜在特征,同时提出了huat模型(hierarchical underwater acoustictransformer,层次水下声学转换器模型),这是一个基于swin transformer架构(滑窗转换器架构)的分类器,使用huat模型能够有效提取高级特征并进行船舶分类,特别是在低信噪比或复杂海洋环境下。

4、然而,目前已提出的基于transformer模型的船舶辐射噪声分类方法存在局限性,特别是将水声领域知识嵌入到transformer模型时,在算法复杂度上存在挑战,尽管swintransformer模型相对于cnn模型、纯transformer模型在计算上更为高效,但它仍然需要占用较多的计算资源,特别是在处理大尺寸的特征图像或进行复杂水声目标识别任务的时候。


技术实现思路

1、本申请的实施例的主要目的在于提出一种基于cnn-transformer合作网络模型的水声目标识别方法,充分利用了cnn在处理空间层次的局部特征上的优势以及transformer在全局上下文建模方面的能力,大幅提升了水声目标识别的速度、效率和精度。

2、为实现上述目的,本申请的实施例提供了一种基于cnn-transformer合作网络模型的水声目标识别方法,包括以下步骤:对获取到的待识别水声信号的音频数据,通过梅尔滤波器组进行滤波处理,将所述待识别水声信号的音频数据的频谱转换为梅尔频谱图;将所述梅尔频谱图输入至预训练的cnn-transformer合作网络模型中,获取所述cnn-transformer合作网络模型输出的对所述待识别水声信号的水声目标识别结果;其中,所述cnn-transformer合作网络模型由局部特征提取层、全局特征提取层和分类层组成;所述局部特征提取层采用cnn作为网络结构,用于先对所述梅尔频谱图进行初步特征提取,得到第一特征,再对所述第一特征进行通道维度的自适应重新校准,得到第二特征;所述全局特征提取层采用融合了通道注意力机制的swin transformer作为网络结构,用于基于所述第二特征进行全局依赖关系的特征提取,得到空间通道联合特征;所述分类层用于基于所述空间通道联合特征,预测出对所述待识别水声信号的水声目标识别结果。

3、为实现上述目的,本申请的实施例还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的基于cnn-transformer合作网络模型的水声目标识别方法。

4、为实现上述目的,本申请的实施例还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的基于cnn-transformer合作网络模型的水声目标识别方法。

5、本申请的实施例提出的基于cnn-transformer合作网络模型的水声目标识别方法,首先在局部特征提取层利用cnn的强大局部特征提取能力来处理待识别水声信号的音频数据的梅尔频谱图,快速捕捉其局部特征,并进行通道维度的自适应重新校准,在不增加计算负担的情况下,自动确定每个通道的重要性,进一步提升局部特征的代表性,在后续的全局特征提取层充分利用transformer在全局上下文建模方面的强大能力,在全局层面上进行进一步的深度特征提取,全局特征提取层采用融合了通道注意力机制的swintransformer作为网络结构,swin transformer是一种变体transformer模型,通过引入窗口划分机制来降低自注意力操作的计算复杂度,非常适合于大规模数据和特征的处理,通道注意力机制的融入帮助全局特征提取层更精准地建模水声信号的全局依赖关系,从而提取出空间通道联合特征,本申请构建、训练并使用这样的cnn-transformer合作网络模型进行水声目标识别,大幅提升了水声目标识别的速度、效率和精度,并且具有很强的稳定性、鲁棒性和普适性。

6、在一些可选的实施例中,所述局部特征提取层由一个7×7卷积层、一个3×3池化层和一个高效通道注意力层组成,所述7×7卷积层后和所述3×3池化层后均设置有批量归一化层和relu(rectified linear unit,线性整流函数)激活函数层,所述高效通道注意力层由四个串联的eca-res模块(efficient channel attention residual,高效通道注意力残差模块)组成,所述四个串联的eca-res模块按串联顺序分为数量相等的两组;所述7×7卷积层和所述3×3池化层用于对所述梅尔频谱图进行初步特征提取并完成两次下采样,得到第一特征;所述高效通道注意力层用于对所述第一特征进行通道维度的自适应重新校准,并通过两组eca-res模块完成两次下采样,得到第二特征。eca-res模块的嵌入使得局部特征提取层能够聚焦于信息更丰富的通道来增强整个本文档来自技高网...

【技术保护点】

1.一种基于CNN-Transformer合作网络模型的水声目标识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于CNN-Transformer合作网络模型的水声目标识别方法,其特征在于,所述局部特征提取层由一个7×7卷积层、一个3×3池化层和一个高效通道注意力层组成,所述7×7卷积层后和所述3×3池化层后均设置有批量归一化层和ReLU激活函数层,所述高效通道注意力层由四个串联的ECA-Res模块组成,所述四个串联的ECA-Res模块按串联顺序分为数量相等的两组;

3.根据权利要求2所述的基于CNN-Transformer合作网络模型的水声目标识别方法,其特征在于,所述对所述第一特征进行通道维度的自适应重新校准,并通过两组ECA-Res模块完成两次下采样,得到第二特征,通过以下公式实现:

4.根据权利要求3所述的基于CNN-Transformer合作网络模型的水声目标识别方法,其特征在于,所述全局特征提取层由第一Swin Transformer网络、第二Swin Transformer网络和补丁合并层组成,所述补丁合并层串联在所述第一Swin Transformer网络和所述第二Swin Transformer网络之间,所述第一Swin Transformer网络由串联的三组共六层的Swin-ECA-T层组成,所述第二Swin Transformer网络由串联的一组共两层的Swin-ECA-T层组成;

5.根据权利要求4所述的基于CNN-Transformer合作网络模型的水声目标识别方法,其特征在于,每个所述一组共两层的Swin-ECA-T层均由第一Swin-ECA-T层和第二Swin-ECA-T层组成,所述第一Swin-ECA-T层由顺序连接的第一个归一化层、高效通道注意力层、窗口化的自注意力层、第二个归一化层和多层感知机组成,所述第二Swin-ECA-T层由顺序连接的第一个归一化层、高效通道注意力层、跨窗口连接的自注意力层、第二个归一化层和多层感知机组成,同一组的第一Swin-ECA-T层的输出和第二Swin-ECA-T层的输出,通过公式表示为:

6.根据权利要求1至权利要求5中任一项所述的基于CNN-Transformer合作网络模型的水声目标识别方法,其特征在于,所述分类层由全局平均池化层、全连接层、LogSoftmax分类器和输出层组成;所述全局平均池化层和所述全连接层用于对所述第二特征进行关键特征提取和整合,得到第三特征;所述LogSoftmax分类器用于基于内置的LogSoftmax函数和所述第三特征,计算所述待识别水声信号对于各类别的分类概率;所述输出层用于基于所述待识别水声信号对于各类别的分类概率,输出对所述待识别水声信号的水声目标识别结果。

7.根据权利要求1至权利要求5中任一项所述的基于CNN-Transformer合作网络模型的水声目标识别方法,其特征在于,所述预训练的CNN-Transformer合作网络模型,通过以下步骤训练得到:

8.根据权利要求7所述的基于CNN-Transformer合作网络模型的水声目标识别方法,其特征在于,在对所述初始网络进行迭代训练时,使用Adam算法优化梯度,初始学习率设置为0.001,批处理大小设置为16,迭代次数设置为200次。

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至权利要求8中任一项所述的基于CNN-Transformer合作网络模型的水声目标识别方法。

...

【技术特征摘要】

1.一种基于cnn-transformer合作网络模型的水声目标识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于cnn-transformer合作网络模型的水声目标识别方法,其特征在于,所述局部特征提取层由一个7×7卷积层、一个3×3池化层和一个高效通道注意力层组成,所述7×7卷积层后和所述3×3池化层后均设置有批量归一化层和relu激活函数层,所述高效通道注意力层由四个串联的eca-res模块组成,所述四个串联的eca-res模块按串联顺序分为数量相等的两组;

3.根据权利要求2所述的基于cnn-transformer合作网络模型的水声目标识别方法,其特征在于,所述对所述第一特征进行通道维度的自适应重新校准,并通过两组eca-res模块完成两次下采样,得到第二特征,通过以下公式实现:

4.根据权利要求3所述的基于cnn-transformer合作网络模型的水声目标识别方法,其特征在于,所述全局特征提取层由第一swin transformer网络、第二swin transformer网络和补丁合并层组成,所述补丁合并层串联在所述第一swin transformer网络和所述第二swin transformer网络之间,所述第一swin transformer网络由串联的三组共六层的swin-eca-t层组成,所述第二swin transformer网络由串联的一组共两层的swin-eca-t层组成;

5.根据权利要求4所述的基于cnn-transformer合作网络模型的水声目标识别方法,其特征在于,每个所述一组共两层的swin-eca-t层均由第一swin-eca-t层和第二swin-eca-t层组成,所述第一swin-eca-t层由顺序连接的第一个归一化层、...

【专利技术属性】
技术研发人员:曾向阳晋安其杨爽王海涛任树伟雷烨
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1