基于多分主干外部注意力网络的水声信号识别方法技术

技术编号：39969835 阅读：10 留言：0更新日期：2024-01-09 00:42

本发明专利技术涉及一种基于多分主干外部注意力网络的水声信号识别方法。首先将输入数据通过多个并行的主干网络分支，提取水声信号不同层级的特征信息；其次，辅以通道、空间注意力模块对水声信号的通道和空间维度分别进行加权，调节不同通道和空间位置对特征表示的重要性；最后，整合外部注意力模块，以外部记忆单元和附加计算来引导网络的特征提取和预测，从而显著提高模型的识别率和鲁棒性。大量的实验证实了本发明专利技术算法相对于现有方法的优越性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于水声信号识别领域，用于船舶辐射噪声信号识别，具体涉及一种基于多分主干外部注意力网络的水声信号识别方法。

技术介绍

1、水声信号识别近年来备受关注，由于海洋水声信道具有时变空变特性、水声目标复杂的声源特征和水声独特的传播方式，使得水声信号识别任务面临巨大挑战。在水声信号识别领域早期，传统水声信号识别基本是采用基于浅层学习的方法[1]，包括预处理、特征提取、特征选择和分类器设计四个环节。特征提取方法是水声信号识别任务的重中之重，其有效性直接影响水声信号的识别性能，传统的水声信号识别方法难以充分获取目标的表征信息且不具备良好的抗噪声能力，识别效果有待提升。

技术实现思路

1、本专利技术的目的在于克服现有水声信号识别的局限性，提供一种基于多分主干外部注意力网络的水声信号识别方法，该专利技术采用多分支主干网络结构以更好地捕获输入数据的局部细节和全局特征，同时加速模型的收敛速度。辅以通道注意和空间注意力模块来降低海洋背景噪声和多目标噪声的特征权重，更好地捕捉输入数据中的空间结构和上下文信息。最后，该专利技术还在全连接层前添加外部注意力模块。该模块在复杂度低于自注意力的前提下，可以挖掘整个水声数据集的潜在关系，增强模型的感知能力和泛化能力，从而提高专利技术的识别效果。与此同时，将不同的数据增强方法分别应用到一维的时域、频域数据和二维的时频图上，实验结果表明，本专利技术提出的meanet能够有效地提高水声信号识别的准确率。

2、为实现上述目的，本专利技术的技术方案是：一种

3、在本专利技术一实施例中，输入数据在输入多个并行的主干网络分支前还需进行数据预处理、数据增强操作，即输入数据通过数据预处理操作，去除空白段并切片为时域信号、频域信号和时频域信号，而后进行相应的数据增强后，输入到多个并行的主干网络分支中进行训练。

4、在本专利技术一实施例中，所述数据预处理具体实现如下：

5、对于时域输入，利用matlab将音频文件切片为时域信号，输入数据每个样本的长度为2048，样本总数从公式(1)中获得，生成样本后，将总样本的80％作为训练集，总样本中的20％作为测试集；

6、

7、其中，l是每个信号的长度，n是总样本数，floor是向负无穷方向舍入的意思；

8、对于频域输入，使用fft函数将输入数据每个样本xi从时域转换到等式(2)所示的频域，数据长度将减半，新样本表示为：

9、

10、其中，算子fft(·)表示将xi变换到频域，并取结果的前半部分；

11、对于时频域输入，对每个样本xi应用短时傅立叶变换stft，以获得等式(3)所示的时频表示，使用汉宁窗口，窗口长度为64，生成时频表示，如下所示：

12、

13、其中，算子sfft(·)表示将xi变换到时频域。

14、在本专利技术一实施例中，对于时频域输入，stft的信号大小调整为330×330，时域和频域输入保持不变。

15、在本专利技术一实施例中，所述数据增强具体实现如下：

16、一维输入数据增强

17、randomaddgaussian：该策略将高斯噪声随机添加到输入信号中，公式如下：

18、x：＝x+n (4)

19、其中x是一维输入信号，n由高斯分布n(0,0.01)生成；

20、randomscale：该策略将输入信号与随机因子随机相乘，其公式如下：

21、x:＝β*x (5)

22、其中x是一维输入信号，β是高斯分布n(0,0.01)之后的定标器；

23、randomstretch：该策略将信号重采样成随机比例，并通过置零和截断来确保长度相等；

24、randomcrop：该策略随机地覆盖部分信号，其公式如下：

25、x:＝mask*x (6)

26、其中x是一维输入信号，mask是随机位置的子序列为零的二进制序列；

27、二维输入数据增强

28、randomscale：该策略将输入信号与随机因子随机相乘，其公式如下：

29、x:＝β*x (7)

30、其中x是二维输入信号，β是高斯分布n(0,0.01)之后的定标器；

31、randomcrop：该策略随机地覆盖部分信号，其公式如下：

32、x:＝mask*x (8)

33、其中x是二维输入信号，mask是随机位置的子序列为零的二进制序列。

34、在本专利技术一实施例中，所述多个并行的主干网络分支包括多分支主干网络和注意力模块；其中，

35、多分支主干网络由卷积分支、恒等连接和批量归一化层组成，卷积分支的卷积核大小分别为1×1和3×3，在每个分支中，卷积层之后是批量归一化层，其中3×3卷积层用于提取更细节的特征，1×1卷积层用于降低特征的维度并提高计算效率，每个分支提取的特征进行融合和整合，得到更加丰富和完整的特征表示，一方面，多分支主干网络汇总的结果流入注意力机制网络，另一方面，多分支主干网络汇总跳过注意力模块进入下一步操作；

36、注意力模块包括通道注意模块cam、空间注意模块sam和外部注意力模块eam；通道注意模块cam和空间注意模块sam作串行使用，将上一层输出的特征作为通道注意模块cam的输入，经过通道注意模块cam后得到的权值，作为空间注意模块sam的输入，得到新的特征值继续参与模型训练。

37、在本专利技术一实施例中，所述通道注意模块cam将上一层网络的输出作为通道注意模块cam的输入h×w×c，经过平均池化层avgpool和最大池化层maxpool得到新的特征，如公式(9)所示，输出原始船舶信号中有意义的特征：

38、

39、其中，mc(f)的大小是f的通道数，即c；f特征的大小为c×h×w，c为通道数，h为高度，w是宽度；mlp为多层感知器操作；σ()表示sigmoid激活函数；w0为的矩阵，r为减少因子用于减少mlp的复杂性和计算量；w1为的矩阵，为平均池化操作后得到的c维全局描述向量，为最大池化操作后得到的c维全局描述向量。

40、在本专利技术一实施例中，所述空间注意模块sam获取通道注意模块cam特征作为输入，而后在平均池化层avgpool和最大池化层maxpool中选本文档来自技高网...

【技术保护点】

1.一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，首先将输入数据通过多个并行的主干网络分支，提取水声信号不同层级的特征信息；其次，辅以通道、空间注意力模块对水声信号的通道和空间维度分别进行加权，调节不同通道和空间位置对特征表示的重要性；最后，整合外部注意力模块，以外部记忆单元和附加计算来引导网络的特征提取和预测。

2.根据权利要求1所述的一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，输入数据在输入多个并行的主干网络分支前还需进行数据预处理、数据增强操作，即输入数据通过数据预处理操作，去除空白段并切片为时域信号、频域信号和时频域信号，而后进行相应的数据增强后，输入到多个并行的主干网络分支中进行训练。

3.根据权利要求2所述的一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，所述数据预处理具体实现如下：

4.根据权利要求3所述的一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，对于时频域输入，STFT的信号大小调整为330×330，时域和频域输入保持不变。

5.根据权利要求2所述的

6.根据权利要求1所述的一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，所述多个并行的主干网络分支包括多分支主干网络和注意力模块；其中，

7.根据权利要求6所述的一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，所述通道注意模块CAM将上一层网络的输出作为通道注意模块CAM的输入H×W×C，经过平均池化层AvgPool和最大池化层MaxPool得到新的特征，如公式(9)所示，输出原始船舶信号中有意义的特征：

8.根据权利要求7所述的一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，所述空间注意模块SAM获取通道注意模块CAM特征作为输入，而后在平均池化层AvgPool和最大池化层MaxPool中选择池化层进行池化后再进行卷积，得到在原始船舶信号中需要关注的区域特征的值，如公式(10)所示：

9.根据权利要求8所述的一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，所述外部注意力模块EAM由两个部分组成：一个或多个可学习的查询向量和与输入数据进行比对的外部记忆单元首先，通过计算查询向量和外部记忆单元中每个记忆向量间的关系，生成注意力权重，接着，将注意力权重利用加权平均或加权池化的方式应用于输入数据的不同维度，以生成新的调节后的特征表征，计算公式如下：

...

【技术特征摘要】

3.根据权利要求2所述的一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，所述数据预处理具体实现如下：

4.根据权利要求3所述的一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，对于时频域输入，stft的信号大小调整为330×330，时域和频域输入保持不变。

5.根据权利要求2所述的一种基于多分主干外部注意力网络的水声信号识别方法，其特征在于，所述数据增强具体实现如下：

6.根据权利要求1所述的一种...

【专利技术属性】
技术研发人员：颜佳泉，王越，李佐勇，
申请(专利权)人：闽江学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人