当前位置: 首页 > 专利查询>东南大学专利>正文

基于主动深度学习的水下目标识别方法技术

技术编号:29255610 阅读:13 留言:0更新日期:2021-07-13 17:26
本发明专利技术公开了一种基于主动深度学习的水下目标识别方法,包括如下步骤:1、对声呐信号原始数据进行预处理,并将其划分为备选集和测试集;2、从步骤1中划分的备选集中,选择一部分数据,标注后从备选集移动到训练集,作为初始训练数据;3、使用训练集中的数据训练CNN模型,并在训练完成时记录模型性能;4、在剩余的备选集中,按照主动学习策略,挑选一定数量的数据,标注后移动到训练集;5、重复步骤3和4,直至备选集中的所有数据都加入训练集;6、模型训练结束,根据每步记录的模型性能,得出模型性能随训练数据量的变化关系。本发明专利技术在相关任务中有显著的降低数据标注成本、提升数据标注效率的作用。

【技术实现步骤摘要】
基于主动深度学习的水下目标识别方法
:本专利技术涉及一种基于主动深度学习的水下目标识别方法,属于数字信号处理和海洋学的交叉领域。
技术介绍
:通过声呐回波可以快速、便捷地判断水下物体的位置、类型等情况,也可以使用声呐与其它舰船进行通信。声呐系统现已被军用和民用舰船广泛采用,在军用领域,装备了声呐的舰船和潜艇,配合水下目标检测技术可以迅速、有效地识别敌方舰艇,提高海军作战能力;在民用方面,远洋渔业、考古作业、沉船打捞等工作都广泛使用声呐来提高工作效率。在实际应用上,由于海洋环境的复杂和操作条件的变化,以及各种噪声的存在,识别算法的性能和效率的提升工作十分具有挑战性。传统的分类识别算法,多采用数学建模或人工构造特征的方法,这类方法在复杂的海洋环境中的泛化性能较弱,其数据处理效率也难以达到要求。随着深度学习技术的快速发展,将神经网络运用在水下目标识别方面的研究也取得了不错的成果,其在对声呐回波和声呐图像进行识别分类的任务中,相比传统识别算法,不仅有更高的准确率和更好的泛化性能,还大大提高了数据处理效率。在水下目标识别领域,获取足够多的高质量标注的训练数据往往比较困难。声呐信号数据的标记工作通常需要较多的专业知识储备和大量训练的经验积累,且进行数据标注的时间代价也较大,因此声呐数据的人工标注的成本很高。数据标注成本过高,或者数据标注的效率过低等问题也常常成为相关研究开展的瓶颈。因为上述问题的存在,主动学习技术被引入水下目标识别领域。主动学习技术是指在机器学习过程中,通过特定的采样策略,迭代地选择未标注的数据集中的一部分数据送由专家进行标记,再将标记后的数据添加到训练集中进行训练并更新模型的方法。由于主动学习中采样策略的存在,选择出的供专家进行标注的数据是不确定性较高、信息量较大的数据,因而对当前模型的性能提升较大。
技术实现思路
针对水下目标识别领域存在的数据标注成本过高、效率过低的问题,本专利技术提出了一种基于主动深度学习的水下目标识别方法。通过将主动学习样例选择策略与深度学习模型的训练相结合,从未标注数据中选择对模型性能提升较大的数据,优先对这部分数据进行标注并将其用于模型训练,将可以较快地提升模型的性能,从而降低相关领域专家的数据标注工作量,提升数据标注效率。上述目的通过以下技术方法实现:一种基于主动深度学习的水下目标识别方法,该方法包括如下步骤:步骤1:对水声信号原始数据进行预处理,并将其划分为备选集和测试集,备选集和测试集为互斥关系。建立初始状态下为空集的训练集。步骤2:从步骤1中划分的备选集中,选择一部分数据,获取标注后从备选集移动到训练集,作为初始训练数据。步骤3:使用训练集中的数据训练CNN模型,并在训练完成时记录模型性能。步骤4:在剩余的备选集中,按照主动学习策略,挑选一定数量的数据,获取标注后移动到训练集。步骤5:重复步骤3和4,直至备选集中的所有数据都加入训练集。步骤6:模型训练结束,根据每步记录的模型性能,得出模型性能随训练数据量的增多而增长的变化关系。上述基于主动深度学习的水下目标识别方法,其步骤1中所述的对水声信号原始数据进行预处理,所述的数据预处理方法包括:对声信号高频部分进行预加重、将较长时间的信号划分为较短的片段的分帧、使帧的边缘平滑过渡到0的加窗。上述基于主动深度学习的水下目标识别方法,其步骤1中所述的将水声信号数据划分为互斥的备选集和测试集,具体方法是:从所有预处理后的水声信号数据中,随机抽取20%作为测试集,剩余作为备选集。并对测试集中的数据进行标注以作为CNN模型性能评判的标准。上述基于主动深度学习的水下目标识别方法,其步骤3中所述的使用训练集中的数据训练CNN模型,所述的CNN模型的结构如表1所示,共包含五个特征提取模块,前三个模块为一个卷积层+一个池化层的结构,后两个模块为两个个卷积层+一个池化层的结构。随后连接三个全连接层,其中,第一个全连接层使用Dropout随机舍弃一部分神经元的输出,以降低过拟合;最后一个全连接层使用Softmax分类输出。此外,本文实验处理的是一维声呐回波数据,故网络中的特征图、卷积核和池化核都调整为一维结构。表1卷积神经网络结构上述基于主动深度学习的水下目标识别方法,其步骤4中所述按照主动学习策略挑选一定数量的数据,其中所述主动学习样本选择策略包括:“不确定性标准”主动学习策略,以及“不确定性+多样性标准”主动学习策略。上述基于主动深度学习的水下目标识别方法中,所述“不确定性标准”主动学习样本选择策略的具体步骤是,从未标注样本中选择模型判定最模糊的样例,即模型对其所属类别的置信度最低的样例。对每一个样例x,使用分类器输出的可能性最大的两个预测的概率计算其不确定性,即unc(x):式中,p(y1|x)和p(y2|x)分别表示分类器输出中,样例x可能性最大和次大的两个所属类别的概率。unc(x)的值越大,说明模型对可能性最大的样例的置信度越高,分类器越不可能将样例分错。因此,主动学习器选择unc(x)值最小的样例作为不确定性最大的样例,送予标注并添加进训练集。上述基于主动深度学习的水下目标识别方法中,所述“不确定性+多样性标准”主动学习样本选择策略的具体步骤是,在“不确定性标准”的基础上,使用距离度量来判断样例多样性,再将不确定性和多样性综合考虑,选择不确定性较高、样本多样性较大的数据作为选择结果。使用高斯核距离来度量两个样本xi和xj之间的相似度:其中,σ是高斯核参数,在本专利技术中设为1。计算样例x对于某个由样例构成的集合Z的相似度时,用样例样例x与集合Z中和它相似度最大的样例之间的距离来表示:sim(x,Z)值越小,说明样例x与集合Z之间的相似度越小,亦即样例x与集合Z中已有元素的冗余程度越小,这样选择出的样例的多样性越大。使用“不确定性+多样性标准”的主动学习策略选择n个样例用于训练,则先使用“不确定性标准”选择m个不确定性较大的样本构成集合M={x1,x2,…,xm},再从M中使用如下式所示的综合考虑不确定性和多样性的方法,选择n个最优的样本:score(x)=λunc(x)+(1-λ)sim(x,M)其中,λ为权衡参数,用于衡量不确定性和多样性的重要程度,在本专利技术中设为0.8。最终计算出的score(x)分值最小的样例是综合考虑不确定性和多样性都较大的样例,其训练价值最大。有益效果:1、本专利技术构建了将主动学习策略以迭代的方式集成到深度学习模型训练过程中的框架,即并非使用主动学习策略一次性选取部分数据并观察使用这部分数据训练后的模型性能,而是少了、多次地进行数据筛选,并观察模型在训练数据增多时的性能变化。这样的集成方式带来的优点包括:实验结果不依赖于模型在初始状态下的性能;以及,可以记录每次数据选择和模型训练的结果,方便进行对比分析。2、本专利技术的两种主动学习样本选择策略,相比于不对样本进行选择的学习方法本文档来自技高网
...

【技术保护点】
1.一种基于主动深度学习的水下目标识别方法,其特征在于,该方法包括如下步骤:/n步骤1:对水声信号原始数据进行预处理,并将其划分为备选集和测试集,备选集和测试集为互斥关系,建立初始状态下为空集的训练集;/n步骤2:从步骤1中划分的备选集中,选择一部分数据,获取标注后从备选集移动到训练集,作为初始训练数据;/n步骤3:使用训练集中的数据训练CNN模型,并在训练完成时记录模型性能;/n步骤4:在剩余的备选集中,按照主动学习策略,挑选一定数量的数据,获取标注后移动到训练集;/n步骤5:重复步骤3和4,直至备选集中的所有数据都加入训练集;/n步骤6:模型训练结束,根据每步记录的模型性能,得出模型性能随训练数据量的增多而增长的变化关系。/n

【技术特征摘要】
1.一种基于主动深度学习的水下目标识别方法,其特征在于,该方法包括如下步骤:
步骤1:对水声信号原始数据进行预处理,并将其划分为备选集和测试集,备选集和测试集为互斥关系,建立初始状态下为空集的训练集;
步骤2:从步骤1中划分的备选集中,选择一部分数据,获取标注后从备选集移动到训练集,作为初始训练数据;
步骤3:使用训练集中的数据训练CNN模型,并在训练完成时记录模型性能;
步骤4:在剩余的备选集中,按照主动学习策略,挑选一定数量的数据,获取标注后移动到训练集;
步骤5:重复步骤3和4,直至备选集中的所有数据都加入训练集;
步骤6:模型训练结束,根据每步记录的模型性能,得出模型性能随训练数据量的增多而增长的变化关系。


2.根据权利要求1所述的基于主动深度学习的水下目标识别方法,其特征在于,步骤1中所述的对水声信号原始数据进行预处理,所述的数据预处理方法包括:对声信号高频部分进行预加重、将较长时间的信号划分为较短的片段的分帧、使帧的边缘平滑过渡到0的加窗。


3.根据权利要求1所述的基于主动深度学习的水下目标识别方法,其特征在于,步骤1中所述的将水声信号数据划分为互斥的备选集和测试集,具体方法是:从所有预处理后的水声信号数据中,随机抽取20%作为测试集,剩余作为备选集,并对测试集中的数据进行标注以作为CNN模型性能评判的标准。


4.根据权利要求1所述的基于主动深度学习的水下目标识别方法,其特征在于,步骤3中所述的使用训练集中的数据训练CNN模型,其中所述的CNN模型的结构如下表所示,它包含五个特征提取模块,前三个模块为一个卷积层+一个池化层的结构,后两个模块为两个卷积层+一个池化层的结构;特征提取后将输出展开成向量,随后连接三个全连接层,其中,第一个全连接层使用Dropout随机舍弃一部分神经元的输出,以降低过拟合;最后一个全连接层使用Softmax分类输出;此外,处理的是一维声呐回波数据,故网络中的特征图、卷积核和池化核都调整为一维结构;








5.根据权利要求1所述的基于主动深度学习的水下目标识别方法,其特征在于,步骤4中所述按照主动学习策...

【专利技术属性】
技术研发人员:吕健坤姜龙玉
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1