一种抑制水声目标识别中数据集不平衡的样本扩充方法技术

技术编号：40874518 阅读：3 留言：0更新日期：2024-04-08 16:43

本发明专利技术提供了一种抑制水声目标识别中数据集不平衡的样本扩充方法，充分利用卷积神经网络的学习和决策性能，将卷积神经网络应用到CGAN网络的生成器和判别器，生成器中采用三层卷积神经网络，依据学习到的特征，针对性的生成数量较少的类别样本，判别器采用一层卷积神经网络的结构，在每次训练中判断生成器生成的时频特征和真实样本的时频特征的真伪并将判定结果反馈给生成器促使生成器生成质量更高的时频特征样本，在此CGAN网络中，输入由水声样本的时频特征代替了原始的水声信号，使得生成器能更好地学习数据特征。该网络可以自主定义生成数据的类别，定向补充数据集，解决因数据集中某类数据占比太小的不平衡问题引起的整体识别准确率不高的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于水声信号处理，具体涉及一种抑制水声目标识别中数据集不平衡的样本扩充方法。

技术介绍

1、水声目标识别是一项涉及信号处理、声呐技术、模式识别技术等多项学科的综合性课题，它在多个领域得到广泛应用，包括海洋环境测深与建模、海底目标定位与识别，以及水雷、潜艇等水下目标物的探测与识别。

2、随着计算机硬件技术、信号处理技术的进一步发展，以机器学习(machinelearning,ml)、深度学习(deep learning,dl)、大数据(big date)等为代表的人工智能(artificial intelligence,ai)技术已经广泛运用于水声信号智能化目标识别技术研究，可有效提高自主识别系统的泛化能力和环境适应性。

3、近些年来，深度神经网络广泛应用于各领域且都展现出较好的效果，也有不少研究者将其应用于水声目标识别中。尽管水声目标噪声数据量有限，但深度学习仍可发挥其在特征学习和抗噪等方面的优势，尤其是深度神经网络这种一体化的网络结构为实现参数联合优化提供了条件。

4、然而，在实际应用中，水声样本数量往往比较有限且存在数据集不平衡的现象，即数据集中各个类别的比例存在比较显著的差异。当这种问题存在时，深度神经网络往往会偏向于数量较大的类别，这样就会对识别结果产生不利影响，使得深度学习方法在实际应用中不能达到最好的识别性能。

5、条件生成对抗网络(conditional generative adversarial nets，cgan)是生成对抗网络的一种扩展，它通过在生成

6、目前，cgan网络在样本补充方面只应用于图像领域，并且使用cgan网络生成补充样本在目前的应用领域都是直接生成样本，而无法生成时频特征。

7、水声信号在传播过程中受环境影响较大，存在着数据获取困难、样本数据少、噪声干扰强等特点，在实际的应用场景中，很难针对每一种水下目标收集到足量的数据，这就会引起水声样本数据集不平衡现象。这类现象常常使得训练好的深度神经网络在测试和应用过程中达不到训练时的效果。cgan网络生成式模型能很好避免后续识别模型的过拟合或者欠拟合的问题，并且很好地关注到了数据样本中占比较少的类别的信息。

8、综上所述，如何采用cgan网络与神经网络结合，去抑制水声目标识别中数据集不平衡，是值得技术人员去探索的。

技术实现思路

1、本专利技术的目的在于解决现有技术无法应对水声样本部分类别收集到的数量不足引起的深度学习模型训练效果不佳的问题，本专利技术提出了抑制水声目标识别中数据集不平衡的样本扩充方法。卷积神经网络可以较好得学习特征及分类的特性，搭建基于卷积神经网络的cgan网络。当某类水声样本数量较少不足以支撑识别网络的训练时，可以使用此cgan网络有针对性地生成数量较少的类别的数据样本，定向补充数据集使之平衡。

2、为实现上述目的，本专利技术所提供的技术解决方案是：一种抑制水声目标识别中数据集不平衡的样本扩充方法，包括以下步骤：

3、步骤1：对样本数量失配的水声信号按照种类信息进行分类，组成数据集，并对数据集进行训练集和测试集的划分；

4、步骤2：对步骤1得到的数据集进行分帧和加窗，并在帧内进行快速傅里叶变换，计算能量谱以得到水声信号的时频特征；

5、步骤3:搭建cgan网络的生成器，其中生成器由三层卷积神经网络组成，且在各层网络之间的leakyrelu激活函数为leakyrelu函数；leakyrelu激活函数的公式为：

6、

7、其中a为每一层神经网络的输出；

8、步骤4:搭建cgan网络的判别器，判别器由一层卷积神经网络组成，激活函数为sigmoid激活函数，公式为：

9、

10、其中b为每一层神经网络的输出，sigmoid函数的输出在(0,1)之间；

11、步骤5：将想要生成的类别标签与符合正态分布的随机噪声一起输入生成器中；

12、步骤6：将生成器生成的虚假时频特征和步骤2获得的数据集中真实的时频特征一起输入判别器中；

13、步骤7：对步骤3建立的生成器和步骤4建立的判别器进行训练；

14、步骤8：训练完成后，将生成的特定种类虚假样本合并入样本数量失配的数据集，使数据集平衡。

15、进一步的，所述步骤1中，对水声数据分为n类，n类水声数据共同组成数据集；其中样本数量足够的类别的数据集按照7:3的比例划分训练集和测试集。样本数量不足的一类数据中划分出与样本数量足够的类别中测试集数量相当的测试集，余下数据作为训练集。

16、进一步的，所述步骤2中包括以下子步骤：

17、步骤2.1：对水声数据集以5khz-10khz的采样率进行采样并做归一化处理，将数据分成短时窗口，窗口大小为30-50毫秒，重叠率设置为50％；

18、步骤2.2：对每个窗口应用汉明窗，并使用python中的库函数对每个窗口应用短时傅里叶变换，将时域信号转换为时频域信号；

19、步骤2.3：使用库函数来执行短时傅里叶变换，从变换结果中提取幅度谱；对幅度谱进行平方操作，得到能量谱；

20、步骤2.4：能量谱特征做归一化处理，获得水声信号的时频特征。

21、进一步的，所述步骤3中，三层卷积神经网络由三个卷积层中间夹着两个批量归一化层；第一个卷积层是一个输入通道数为1，输出通道数为64，卷积核大小为4，步幅为4的一维卷积层；紧接着是一个具有64个特征通道的一维批量归一化层，再接下来是一个输入通道数为64，输出通道数为128，卷积核大小为4，步幅为4的一维卷积层；然后是一个具有128个特征通道的一维批量归一化层；第三个卷积层是一个输入通道数为128，输出通道数为800，卷积核大小为4，步幅为4的一维卷积层。

22、进一步的，所述步骤4中，一层卷积神经网络判别器由一个dropout层、一维卷积层、全连接层和批量归一化层组成；一维卷积层的输入通道数为2，输出通道数为16，卷积核大小为64，步幅为1；全连接层输入特征数为16，输出特征数为4；之后是一个具有16个特征通道的一维批量归一化层。

23、进一步的，所述步骤7中，训练方法包括以下子步骤：

24、步骤7.1:z为服从正态分布的随机噪声,通过生成器生成xfake，判别器负责判别输入的data是生成的样本xfake还是真实样本xreal；

25、步骤7.本文档来自技高网...

【技术保护点】

1.一种抑制水声目标识别中数据集不平衡的样本扩充方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种抑制水声目标识别中数据集不平衡的样本扩充方法，其特征在于，所述步骤1中，对水声数据分为N类，N类水声数据共同组成数据集；其中

3.如权利要求1所述的一种抑制水声目标识别中数据集不平衡的样本扩充方法，其特征在于，所述步骤2中包括以下子步骤：

4.如权利要求1所述的一种抑制水声目标识别中数据集不平衡的样本扩充方法，其特征在于，所述步骤3中，三层卷积神经网络由三个卷积层中间夹着两个批量归一化层；第一个卷积层是一个输入通道数为1，输出通道数为64，卷积核大小为4，步幅为4的一维卷积层；紧接着是一个具有64个特征通道的一维批量归一化层，再接下来是一个输入通道数为64，输出通道数为128，卷积核大小为4，步幅为4的一维卷积层；然后是一个具有128个特征通道的一维批量归一化层；第三个卷积层是一个输入通道数为128，输出通道数为800，卷积核大小为4，步幅为4的一维卷积层。

5.如权利要求1所述的一种抑制水声目标识别中数据集不平衡的样本扩充方

6.如权利要求1所述的一种抑制水声目标识别中数据集不平衡的样本扩充方法，其特征在于，所述步骤7中，训练方法包括以下子步骤：

7.如权利要求6所述的一种抑制水声目标识别中数据集不平衡的样本扩充方法，其特征在于，对所述生成器和判别器采取交替训练，即先训练判别器D，然后训练生成器G。

8.如权利要求7所述的一种抑制水声目标识别中数据集不平衡的样本扩充方法，其特征在于，所述总训练轮次为2000-3000次，前1000-1500次学习率设置为0.0015，后1000次学习率设置为0.0012。

...

【技术特征摘要】

1.一种抑制水声目标识别中数据集不平衡的样本扩充方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种抑制水声目标识别中数据集不平衡的样本扩充方法，其特征在于，所述步骤1中，对水声数据分为n类，n类水声数据共同组成数据集；其中

3.如权利要求1所述的一种抑制水声目标识别中数据集不平衡的样本扩充方法，其特征在于，所述步骤2中包括以下子步骤：

【专利技术属性】
技术研发人员：任树伟，管抗洪，曾向阳，王海涛，雷烨，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人