当前位置: 首页 > 专利查询>东南大学专利>正文

基于主动学习的声呐图像目标识别方法技术

技术编号:23432088 阅读:75 留言:0更新日期:2020-02-25 13:16
本发明专利技术公开了一种基于主动学习的声呐图像目标识别方法,包括如下步骤:步骤1:对声呐图像数据集进行数据增强处理以扩充数据集;步骤2:从步骤1划分的训练集中选出一组样本进行标注,构成初始训练集,并将这些初始训练集的样本从总的训练集中剔除;步骤3.使用初始训练集训练YOLO模型;步骤4:在剔除初始训练集后的剩余样本训练集中利用主动学习样本选择策略挑选一组样本,将选择出的样本进行人工标注,加入训练集训练YOLO模型;步骤5:重复步骤4,直至剩余样本训练集中所有的样本都被选择;步骤6:YOLO模型训练结束,保存权重、经测试集测试以后输出YOLO模型的精度。本发明专利技术极大地降低标注成本,并得到理想的精度。

Sonar image target recognition method based on active learning

【技术实现步骤摘要】
基于主动学习的声呐图像目标识别方法
:本专利技术涉及一种基于主动学习的声呐图像目标识别方法,属于计算机视觉、海洋学等多学科交叉领域。
技术介绍
:声呐图像目标识别技术拥有十分广阔的应用场景,如海洋生物的定位、分类与跟踪,尸体、沉船、飞机残骸等物体的打捞,海洋环境探测等,也多用于军事方面,如潜艇、鱼雷、蛙人等军事目标的识别,具有很高的研究价值。深度学习是一种使用多层网络结构以习得目标更抽象、本质的特征的机器学习模式。相对于浅层学习来说,由于网络结构更为复杂,深度学习更加有利于目标识别任务。当输入训练数据时,深度学习利用其网络结构特性,逐层提取输入数据的特征,从而使目标识别中的分类和定位任务的准确性得到较大的提升。近年来,深度学习在计算机视觉领域取得了重大突破,得到了广泛的应用。目前,深度学习技术已被用于声呐图像目标识别,但它的性能依赖于训练样本的数量和质量,要求训练样本数量大、标记准确。获取大量标记样本是一件耗时且昂贵的工作,在声呐领域还需要有一定的专业背景知识的专家才能完成标注。另一方面,由于声呐设备、传感器等硬件的发展,获取大量未标记样本越来越容易。另外,过多的较低质量的标记样本反而会降低模型的性能,甚至导致“过学习”问题。对于这样一个问题,主动学习给出了其解决方案:在大量未标记样本中依据一定的样本选择算法,从中挑选对模型的训练价值较高的样本交由专家标注后加入训练集来提高模型的精度,以降低领域专家的工作量,而并非将所有的样本进行标记后训练模型。
技术实现思路
针对上述存在的问题,本专利技术提出了一种基于主动学习的声呐图像目标识别方法。通过主动学习策略,根据不同数据样本对于学习模型的贡献度不一样的基本原理,制定多种选择标记样本的标准,选取一部分最有价值的数据交给人工进行标注,极大地降低标注成本,并得到理想的精度。上述的目的通过以下技术方案实现:一种基于主动学习的声呐图像目标识别方法,该方法包括如下步骤:步骤1:对声呐图像数据集进行数据增强处理以扩充数据集,采用“留出法”将数据集划分为两个互斥的集合,一个作为训练集,一个作为测试集;步骤2:从步骤1划分的训练集中选出一组样本进行标注,构成初始训练集,并将这些初始训练集的样本从总的训练集中剔除;步骤3.使用初始训练集训练YOLO模型;步骤4:在剔除初始训练集后的剩余样本训练集中利用主动学习样本选择策略挑选一组样本,将选择出的样本进行人工标注,加入训练集训练YOLO模型,并将选出的样本从剩余样本训练集中剔除;步骤5:重复步骤4,直至剩余样本训练集中所有的样本都被选择;步骤6:YOLO模型训练结束,保存权重、经测试集测试以后输出YOLO模型的精度。所述的基于主动学习的声呐图像目标识别方法,步骤1中所述对声呐图像数据集进行数据增强处理以扩充数据集,所述的数据增强处理的方法包括:随机裁剪、调整曝光度、调整饱和度、调整色调、左右翻转、上下翻转、顺时针旋转90°、顺时针旋转180°、顺时针旋转270°。所述的基于主动学习的声呐图像目标识别方法,步骤1中所述采用“留出法”将数据集划分为两个互斥的集合,一个作为训练集,一个作为测试集的具体方法是:先将扩充后的数据集中的图片随机排列;然后随机抽取75%的图片及对应标签作为训练集,剩下的25%作为测试集。所述的基于主动学习的声呐图像目标识别方法,步骤2中所述从步骤1划分的训练集中选出一组样本进行标注,构成初始训练集的过程中,首先根据边缘方向直方图用k-medoids算法对训练集进行聚类,选取最具代表性的100张图像作为初始训练样本集。所述的基于主动学习的声呐图像目标识别方法,步骤4中所述利用主动学习样本选择策略挑选一组样本,其中所述主动学习样本选择策略包括:基于分类不确定性的样本选择策略;改进的基于分类不确定性样本选择策略;基于数据增强一致性的样本选择策略。所述的基于主动学习的声呐图像目标识别方法,所述基于分类不确定性的样本选择策略的具体步骤是:是从未标注样本集中选择此时模型最难预测的样本,即选择后验概率最低的样本,对于样本预测结果的每一个边界框,定义评价指标分类不确定性UB(B),其计算公式如下所示:UB(B)=1-Pmax(B)其中,Pmax(B)表示该边界框中预测类别概率中最大的概率值,在一个样本中,往往有多个预测边界框,取所有预测边界框分类不确定性最大的边界框的UB(B)值来代表此样本的分类不确定性UC(I),其算法流程如下:a.用此时的模型检测未标注样本集中的所有样本,每个样本得到其边界框的预测值;b.对于每个样本,计算其分类不确定性UC(I);c.将所有未标记样本按照分类不确定性UC(I)从大到小的顺序排序;d.根据排序选择前n个样本,交给专家标注后加入训练集,其中,n为此轮规定的选择样本的数量。所述的基于主动学习的声呐图像目标识别方法,所述改进的基于分类不确定性样本选择策略的具体步骤是:定义分类不确定性指标为对于其计算公式如下所示:UCnew=|log(Pmax)+αlog(s2)|其中,Pmax(B)表示该边界框中预测类别概率中最大的概率值;α是一个权重参数,表示最大概率值与各类概率值离散程度在此指标中所占的权重,经过实验验证,α设置为0.2;s2表示预测所有类的概率的方差,表示各类概率值的离散程度,其计算公式如下所示:其中,n表示总类别数,xi表示边界框中第i类的概率,为概率值的均值,其计算公式如下所示:对于一个样本来说,取所有预测边界框分类不确定性最大的边界框的值来代表此样本的新的分类不确定性所述的基于主动学习的声呐图像目标识别方法,所述基于数据增强一致性的样本选择策略的具体步骤为:选择数据增强的方式为左右翻转,计算原图I以及其翻转图像I′的预测误差的算法的基本流程为:a.将翻转图像I′的预测边界框的位置做相应的翻转处理,翻转图像I′是图像I经过左右翻转得到的,那么就需要将I′的预测边界框也进行左右翻转处理;b.根据图像I与其翻转图像I′预测边界框,计算预测类别和位置的误差,得到两者误差;其中,若图像I只需预测一个目标,则可将两张图像的预测边界框直接进行计算,但是对于一张图像预测多个目标的情况,需要判断翻转图像中的预测框与原图像中的预测框如何一一对应,对于一张图像I,有n个预测边界框B1,B2,...,Bn;其翻转图像I′,有m个预测边界框B1,B2,...,Bm,其中,翻转图像I′的m个预测边界框已经过翻转处理,对于每个预测边界框,都有坐标(x,y)表示边界框中心的位置,判断流程如下:b1.计算图像I的n个预测边界框B1,B2,...,Bn与翻转图像I′的m个预测边界框B1,B2,...,Bm的距离,得到dis(Bi,Bj),其中,1≤i≤n,1≤j≤m。dis(Bi,Bj)的计算如下所示:b2.将步骤b1中计算所得的这m×n组距离按从小到大的顺序排本文档来自技高网...

【技术保护点】
1.一种基于主动学习的声呐图像目标识别方法,其特征在于,该方法包括如下步骤:/n步骤1:对声呐图像数据集进行数据增强处理以扩充数据集,采用“留出法”将数据集划分为两个互斥的集合,一个作为训练集,一个作为测试集;/n步骤2:从步骤1划分的训练集中选出一组样本进行标注,构成初始训练集,并将这些初始训练集的样本从总的训练集中剔除;/n步骤3.使用初始训练集训练YOLO模型;/n步骤4:在剔除初始训练集后的剩余样本训练集中利用主动学习样本选择策略挑选一组样本,将选择出的样本进行人工标注,加入训练集训练YOLO模型,并将选出的样本从剩余样本训练集中剔除;/n步骤5:重复步骤4,直至剩余样本训练集中所有的样本都被选择;/n步骤6:YOLO模型训练结束,保存权重、经测试集测试以后输出YOLO模型的精度。/n

【技术特征摘要】
1.一种基于主动学习的声呐图像目标识别方法,其特征在于,该方法包括如下步骤:
步骤1:对声呐图像数据集进行数据增强处理以扩充数据集,采用“留出法”将数据集划分为两个互斥的集合,一个作为训练集,一个作为测试集;
步骤2:从步骤1划分的训练集中选出一组样本进行标注,构成初始训练集,并将这些初始训练集的样本从总的训练集中剔除;
步骤3.使用初始训练集训练YOLO模型;
步骤4:在剔除初始训练集后的剩余样本训练集中利用主动学习样本选择策略挑选一组样本,将选择出的样本进行人工标注,加入训练集训练YOLO模型,并将选出的样本从剩余样本训练集中剔除;
步骤5:重复步骤4,直至剩余样本训练集中所有的样本都被选择;
步骤6:YOLO模型训练结束,保存权重、经测试集测试以后输出YOLO模型的精度。


2.根据权利要求1所述的基于主动学习的声呐图像目标识别方法,其特征在于,步骤1中所述对声呐图像数据集进行数据增强处理以扩充数据集,所述的数据增强处理的方法包括:随机裁剪、调整曝光度、调整饱和度、调整色调、左右翻转、上下翻转、顺时针旋转90°、顺时针旋转180°、顺时针旋转270°。


3.根据权利要求1所述的基于主动学习的声呐图像目标识别方法,其特征在于,步骤1中所述采用“留出法”将数据集划分为两个互斥的集合,一个作为训练集,一个作为测试集的具体方法是:先将扩充后的数据集中的图片随机排列;然后随机抽取75%的图片及对应标签作为训练集,剩下的25%作为测试集。


4.根据权利要求1所述的基于主动学习的声呐图像目标识别方法,其特征在于,步骤2中所述从步骤1划分的训练集中选出一组样本进行标注,构成初始训练集的过程中,首先根据边缘方向直方图用k-medoids算法对训练集进行聚类,选取最具代表性的100张图像作为初始训练样本集。


5.根据权利要求1所述的基于主动学习的声呐图像目标识别方法,其特征在于,步骤4中所述利用主动学习样本选择策略挑选一组样本,其中所述主动学习样本选择策略包括:基于分类不确定性的样本选择策略;改进的基于分类不确定性样本选择策略;基于数据增强一致性的样本选择策略。


6.根据权利要求5所述的基于主动学习的声呐图像目标识别方法,其特征在于,所述基于分类不确定性的样本选择策略的具体步骤是:是从未标注样本集中选择此时模型最难预测的样本,即选择后验概率最低的样本,对于样本预测结果的每一个边界框,定义评价指标分类不确定性UB(B),其计算公式如下所示:
UB(B)=1-Pmax(B)
其中,Pmax(B)表示该边界框中预测类别概率中最大的概率值,
在一个样本中,往往有多个预测边界框,取所有预测边界框分类不确定性最大的边界框的UB(B)值来代表此样本的分类不确定性UC(I),其算法流程如下:
a.用此时的模型检测未标注样本集中的所有样本,每个样本得到其边界框的预测值;
b.对于每个样本,计算其分类不确定性UC(I);
c.将所有未标记样本按照分类不确定性UC(I)从大到小的顺序排序;
d.根据排序选择前n个样本,交给专家标注后加入训练集,其中,n为此轮规定的选择样本的数量。


7.根据权利要求5所述的基于主动学习的声呐图像目标识别方法,其特征在于,所述改进的基于分类不确定性样本选择策略的具体步骤是:
定义分类不确定性指标为对于其计算公式如下所示:
UCnew=|log(Pmax)+αlog(s2)|
其中,...

【专利技术属性】
技术研发人员:邓雨田姜龙玉
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1