System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 融合注意力机制与深度残差收缩网络的水声目标识别方法技术_技高网

融合注意力机制与深度残差收缩网络的水声目标识别方法技术

技术编号:39978306 阅读:8 留言:0更新日期:2024-01-09 01:19
本发明专利技术公开了融合注意力机制与深度残差收缩网络的水声目标识别方法,该方法首先获取带有标签的水声数据样本,提取水声数据样本的梅尔Mel谱特征、梅尔频率倒谱系数MFCC特征以及其一阶、二阶差分特征。其次以ResNet18网络为基础,结合深度残差收缩网络和空间注意力网络,构建水声目标识别网络模型。最后将步骤1得到的四类特征组合构成四通道的样本,通过上述构建的水声目标识别网络模型进行训练、测试,完成水声目标识别。本发明专利技术实现了有用特征的筛选,提高了特征的完备性,进而提高识别的精确度。

【技术实现步骤摘要】

本专利技术涉及水声目标识别,具体涉及一种融合注意力机制与深度残差收缩网络的水声目标识别方法


技术介绍

1、水声目标识别技术是水声信号处理与声呐应用等领域的重要研究方向,是环境感知、资源勘测、目标监测等海洋应用领域的核心技术之一。传统声呐根据探测方式的差异分为主动声呐和被动声呐。主动声呐向水中发射声信号,利用反射的声信号回波完成目标判定,具有较好的识别精度,但由于主动发射声波会暴露声呐位置,因此在隐蔽性性能方向不具优势。被动声呐通过被测目标产生的噪声来实现识别工作,由于不发射声波,仅需被动接受噪声信号进行判断,因此隐蔽性较好,常被用于舰船目标识别领域的研究。

2、目前,舰船辐射噪声领域常见特征提取方法发展成熟,提取的特征包括时频特征、统计特征、倒谱特征、希尔伯特特征和小波特征等。丰富的特征提取方式使得识别方法变得多种多样。梅尔频率倒谱系数(mfcc)是一种将音频信号转换成一组特征向量的算法,在水声特征提取方面应用较为广泛,其主要思想是利用人类听觉系统的特性,把信号中的音高和音色信息分离出来,并转换成一组更易于处理和区分的特征向量。但是单一特征在单一模型下具有局限性,在某些特殊情况下单一特征并不能完全表现出辐射噪声的各个属性,会影响舰船目标的识别准确率。多种特征融合的模型在特征完备性上具有优势,因此,研究多种特征融合的模型对水声目标识别具有较强的研究价值。

3、其次,分类模型的选取也至关重要。舰船辐射噪声的识别属于复杂的分类问题,以cnn和rnn等为代表的深度学习由于提取到数据的更深层的特征,被广泛应用。但是由于水声数据的噪声干扰较为严重,需要采取一个稳健性更高、提取特征层次更深的神经网络模型进行特征学习。因此,采用更复杂的神经网络工作方式进行特征学习和分类预测,可以更好的完成复杂环境下的舰船辐射噪声信号的识别工作。


技术实现思路

1、本专利技术提出融合注意力机制与深度残差收缩网络的水声目标识别方法以解决现有技术存在的特征学习能力弱、分类正确率低的问题。现有的水声目标识别方法往往基于单一的水声特征进行分类识别,单一特征往往无法完备的表征目标特性,因而本专利技术考虑结合mfcc特征与mel谱特征进行分类识别,同时考虑动态的mfcc特征即其一阶、二阶差分特征,以期学习到帧与帧之间的时域连续性特征。

2、本专利技术的技术方案为:

3、步骤1:获取带有标签的水声数据样本,提取水声数据样本的mel谱特征、mfcc特征以及其一阶、二阶差分特征;

4、步骤2:以resnet18网络为基础,结合深度残差收缩网络(drsn)和空间注意力(sam)网络,构建水声目标识别网络模型,实现深度特征提取和融合;

5、步骤3:将步骤1得到的四类特征组合构成四通道的样本,通过上述构建的水声目标识别网络模型进行训练、测试,完成水声目标识别。

6、本专利技术提出了一种基于注意力机制实现特征融合的深度残差收缩网络的水声目标识别方法。通过提取mel谱特征、mfcc特征以及其一阶二阶差分特征,根据注意力机制下的深度残差收缩网络进行权重分配实现特征融合,经过构建的resnet18结合sam训练后的模型用于水声目标的分类与识别。

7、进一步的,上述步骤1中,所提取样本的mfcc特征包括:

8、对获取的水声数据进行预处理,预处理的过程包括预加重、分帧和加窗;

9、预处理完成后,对每帧信号s1(n)做快速傅里叶变换(fft)得到频谱。对每帧信号做fft得到信号的离散频谱s1(k)为:

10、

11、其中,n为离散时间点,n为样本点数,k为离散频率点。

12、将频谱通过一组三角带通滤波器滤波得到mel滤波。

13、设有m个三角滤波器,中心频率为f(m),其中,m=1,2,…,m。三角滤波器的频率响应公式为:

14、

15、通过滤波器后输出的频谱就是mel谱,即mel谱特征。

16、计算每个滤波器输出的对数能量。

17、将计算的对数能量进行离散余弦变换,求出l阶的mfcc系数,即mfcc特征:

18、

19、通常l取12-16,m指三角滤波器的个数,l为mfcc阶数。

20、根据l个mfcc倒谱系数值计算mfcc一阶差分参数,即一阶差分特征:

21、

22、其中,dt表示第t个一阶差分,ct表示第t个倒谱系数,q表示倒谱系数的阶数,t表示一阶导数的时间差,取1或2。

23、如果对dt再使用上述公式就可以得到二阶差分系数,即二阶差分特征。

24、经过上面的计算公式,得到mfcc特征集和mel特征。

25、进一步的,步骤2中特征向量先经过1个卷积单元(包含卷积层、批量归一化层、relu激活层)进行特征提取,随后输入到四个顺序连接的残差块,然后通过空间注意力单元提取空间特征,最后通过全连接层实现水声目标的分类识别。

26、进一步的,残差块由两个结构相同的深度残差收缩网络块构成,深度残差收缩网络的结构为:

27、深度残差收缩网络由恒等映射层、软阈值化层和通道注意力层组成。恒等映射层作为网络的一个分支,将输入特征进行线性投影来匹配另一分支的特征尺寸。输入特征经过一个1×1卷积层和一个批量归一化层后,输出特征的维度会保持和另一分支的输出特征相同。软阈值化层是深度残差收缩网络的“收缩”部分,软阈值化是将绝对值低于某个阈值的特征置为零,高于和等于阈值的特征减掉阈值后朝着零的方向进行收缩。软阈值化所需要的阈值,是根据通道注意力机制设置的。

28、通道注意力层是输入特征通过该网络层后自动学习到一组权重,权重会作为阈值对特征进行筛选。通道注意力具体为以下过程:

29、1:对于输入的三维特征x1(h,w,c)首先通过取绝对值和全局平均池化操作将特征信息进行压缩得到维度为1×1×c的向量α,计算公式如下:

30、α=|golbalaverage(xh,w,c)|     (5)

31、2:向量α通过一个全连接层后,特征大小为再经过一个relu层,输出维度不变;经过第二个全连接层,输出大小回到1×1×c;后应用sigmoid函数,使注意力参数缩放到(0,1),其计算公式如下:

32、

33、其中,z为全连接层的输出,βc为注意力权重。

34、3:注意力权重βc乘以向量α,得到阈值τ。通过训练,每个样本都有唯一的一组阈值,在软阈值的限制下,更多有用的特征得到融合。

35、进一步的,一个基本的深度残差收缩网络处理特征的过程为:

36、输入特征大小为h×w×c的特征经过两个卷积层后保持通道和空间维度不变,进行分支,一支进入通道注意力层,得到阈值τ。另一支与阈值τ进行软阈值化,将绝对值低于阈值τ的特征置为零,高于和等于τ的特征减掉阈值后向零的方向收缩,得到收缩特征。输入特征经过恒等映本文档来自技高网...

【技术保护点】

1.融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述步骤1中具体过程如下:

3.根据权利要求2所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述预处理的过程包括预加重、分帧和加窗;

4.根据权利要求1所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,步骤2中所述的水声目标识别网络模型具体为:

5.根据权利要求4所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述卷积单元包含顺序连接的卷积层、批量归一化层和ReLU激活层。

6.根据权利要求5所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述残差块由两个结构相同的深度残差收缩网络块构成;

7.根据权利要求6所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述通道注意力层具体实现过程如下:

8.根据权利要求7所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述空间注意力单元:将最后一个深度残差收缩网络的输出特征经过一卷积单元输入空间注意力模块,将空间注意力模块作为残差块与深度残差收缩网络的输出特征相连接,连接过程中对输出特征进行恒等映射。

9.根据权利要求8所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述恒等映射具体过程为:先对输入特征进行1×1卷积操作,再进行批量归一化操作。

10.根据权利要求9所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述空间注意力模块具体过程为:

...

【技术特征摘要】

1.融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述步骤1中具体过程如下:

3.根据权利要求2所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述预处理的过程包括预加重、分帧和加窗;

4.根据权利要求1所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,步骤2中所述的水声目标识别网络模型具体为:

5.根据权利要求4所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述卷积单元包含顺序连接的卷积层、批量归一化层和relu激活层。

6.根据权利要求5所述的融合注意力机制与深度残差收缩网络的水声目标识别方法,其特征在于,所述残差块由...

【专利技术属性】
技术研发人员:杨阿锋庄立旭杨卓霖曹轶群郑文龙章早立
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1