【技术实现步骤摘要】
基于主动学习的声呐图像目标识别方法
:本专利技术涉及一种基于主动学习的声呐图像目标识别方法,属于计算机视觉、海洋学等多学科交叉领域。
技术介绍
:声呐图像目标识别技术拥有十分广阔的应用场景,如海洋生物的定位、分类与跟踪,尸体、沉船、飞机残骸等物体的打捞,海洋环境探测等,也多用于军事方面,如潜艇、鱼雷、蛙人等军事目标的识别,具有很高的研究价值。深度学习是一种使用多层网络结构以习得目标更抽象、本质的特征的机器学习模式。相对于浅层学习来说,由于网络结构更为复杂,深度学习更加有利于目标识别任务。当输入训练数据时,深度学习利用其网络结构特性,逐层提取输入数据的特征,从而使目标识别中的分类和定位任务的准确性得到较大的提升。近年来,深度学习在计算机视觉领域取得了重大突破,得到了广泛的应用。目前,深度学习技术已被用于声呐图像目标识别,但它的性能依赖于训练样本的数量和质量,要求训练样本数量大、标记准确。获取大量标记样本是一件耗时且昂贵的工作,在声呐领域还需要有一定的专业背景知识的专家才能完成标注。另一方面,由于声呐设备、传感器等硬件的发展,获取大量未标记样本越来越容易。另外,过多的较低质量的标记样本反而会降低模型的性能,甚至导致“过学习”问题。对于这样一个问题,主动学习给出了其解决方案:在大量未标记样本中依据一定的样本选择算法,从中挑选对模型的训练价值较高的样本交由专家标注后加入训练集来提高模型的精度,以降低领域专家的工作量,而并非将所有的样本进行标记后训练模型。
技术实现思路
针对上述存在的问题, ...
【技术保护点】
1.一种基于主动学习的声呐图像目标识别方法,其特征在于,该方法包括如下步骤:/n步骤1:对声呐图像数据集进行数据增强处理以扩充数据集,采用“留出法”将数据集划分为两个互斥的集合,一个作为训练集,一个作为测试集;/n步骤2:从步骤1划分的训练集中选出一组样本进行标注,构成初始训练集,并将这些初始训练集的样本从总的训练集中剔除;/n步骤3.使用初始训练集训练YOLO模型;/n步骤4:在剔除初始训练集后的剩余样本训练集中利用主动学习样本选择策略挑选一组样本,将选择出的样本进行人工标注,加入训练集训练YOLO模型,并将选出的样本从剩余样本训练集中剔除;/n步骤5:重复步骤4,直至剩余样本训练集中所有的样本都被选择;/n步骤6:YOLO模型训练结束,保存权重、经测试集测试以后输出YOLO模型的精度。/n
【技术特征摘要】
1.一种基于主动学习的声呐图像目标识别方法,其特征在于,该方法包括如下步骤:
步骤1:对声呐图像数据集进行数据增强处理以扩充数据集,采用“留出法”将数据集划分为两个互斥的集合,一个作为训练集,一个作为测试集;
步骤2:从步骤1划分的训练集中选出一组样本进行标注,构成初始训练集,并将这些初始训练集的样本从总的训练集中剔除;
步骤3.使用初始训练集训练YOLO模型;
步骤4:在剔除初始训练集后的剩余样本训练集中利用主动学习样本选择策略挑选一组样本,将选择出的样本进行人工标注,加入训练集训练YOLO模型,并将选出的样本从剩余样本训练集中剔除;
步骤5:重复步骤4,直至剩余样本训练集中所有的样本都被选择;
步骤6:YOLO模型训练结束,保存权重、经测试集测试以后输出YOLO模型的精度。
2.根据权利要求1所述的基于主动学习的声呐图像目标识别方法,其特征在于,步骤1中所述对声呐图像数据集进行数据增强处理以扩充数据集,所述的数据增强处理的方法包括:随机裁剪、调整曝光度、调整饱和度、调整色调、左右翻转、上下翻转、顺时针旋转90°、顺时针旋转180°、顺时针旋转270°。
3.根据权利要求1所述的基于主动学习的声呐图像目标识别方法,其特征在于,步骤1中所述采用“留出法”将数据集划分为两个互斥的集合,一个作为训练集,一个作为测试集的具体方法是:先将扩充后的数据集中的图片随机排列;然后随机抽取75%的图片及对应标签作为训练集,剩下的25%作为测试集。
4.根据权利要求1所述的基于主动学习的声呐图像目标识别方法,其特征在于,步骤2中所述从步骤1划分的训练集中选出一组样本进行标注,构成初始训练集的过程中,首先根据边缘方向直方图用k-medoids算法对训练集进行聚类,选取最具代表性的100张图像作为初始训练样本集。
5.根据权利要求1所述的基于主动学习的声呐图像目标识别方法,其特征在于,步骤4中所述利用主动学习样本选择策略挑选一组样本,其中所述主动学习样本选择策略包括:基于分类不确定性的样本选择策略;改进的基于分类不确定性样本选择策略;基于数据增强一致性的样本选择策略。
6.根据权利要求5所述的基于主动学习的声呐图像目标识别方法,其特征在于,所述基于分类不确定性的样本选择策略的具体步骤是:是从未标注样本集中选择此时模型最难预测的样本,即选择后验概率最低的样本,对于样本预测结果的每一个边界框,定义评价指标分类不确定性UB(B),其计算公式如下所示:
UB(B)=1-Pmax(B)
其中,Pmax(B)表示该边界框中预测类别概率中最大的概率值,
在一个样本中,往往有多个预测边界框,取所有预测边界框分类不确定性最大的边界框的UB(B)值来代表此样本的分类不确定性UC(I),其算法流程如下:
a.用此时的模型检测未标注样本集中的所有样本,每个样本得到其边界框的预测值;
b.对于每个样本,计算其分类不确定性UC(I);
c.将所有未标记样本按照分类不确定性UC(I)从大到小的顺序排序;
d.根据排序选择前n个样本,交给专家标注后加入训练集,其中,n为此轮规定的选择样本的数量。
7.根据权利要求5所述的基于主动学习的声呐图像目标识别方法,其特征在于,所述改进的基于分类不确定性样本选择策略的具体步骤是:
定义分类不确定性指标为对于其计算公式如下所示:
UCnew=|log(Pmax)+αlog(s2)|
其中,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。