当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于知识蒸馏的少样本目标检测方法技术

技术编号:28038400 阅读:43 留言:0更新日期:2021-04-09 23:21
本发明专利技术提供一种基于知识蒸馏的少样本目标检测方法,其特征在于,包括如下步骤:构建带有标注和标签的图片数据库,使其满足少样本目标检测的条件,并进行一定的数据增强扩充样本的多样性,分为联合训练数据和微调训练数据;选择目标检测框架和backbone网络,构建网络模型,使用联合训练数据训练网络模型,得到权重模型;使用微调训练数据微调步骤二得到的第一权重模型,得到新权重模型,称为第二权重模型;将第二步得到的第一权重模型作为学生网络,第三步得到的第二权重模型作为教师网络,再次使用微调训练数据,根据教师网络对于该微调训练数据的测试结果来进行知识蒸馏,实现微调学生网络权重,得到最终第三权重模型。

【技术实现步骤摘要】
一种基于知识蒸馏的少样本目标检测方法
本专利技术属于少样本物体检测领域,涉及一种少样本目标检测方法,利用知识蒸馏来微调少样本目标检测网络以改善在该条件下的网络过拟合。
技术介绍
在计算机视觉领域,目标检测是一个非常热门的研究课题。尤其是随着卷积神经网络(CNN)的提出并广泛应用于图像处理领域,目标检测得到了快速的发展,并取得了显著的成就[1]。但是一般的基于CNN的目标检测框架往往需要经过一个大型的数据集训练。当面对一项仅有罕见样本的检测任务时,当前目标检测往往不能取得令人满意的效果,这也是一般目标检测技术的局限性。其主要原因是,CNN的表征能力过于强大,当面对样本过少的情况时,过度拟合了这些样本,导致了在新的样本上缺少泛化能力,进而降低了检测能力。因此,为了改善目标检测在少样本条件下的检测性能,必须考虑一种有效改善网络过拟合的方法。过拟合是指在模型参数拟合过程中的问题,由于训练数据包含抽样误差,训练时,复杂的模型将抽样误差也考虑在内,将抽样误差也进行了很好的拟合。它的主要表现就是模型在训练集上效果好,在测试集上效果差,模型泛化能力弱。本文档来自技高网...

【技术保护点】
1.一种基于知识蒸馏的少样本目标检测方法,其特征在于,该方法实现的具体操作步骤如下:/n第一步:构建带有标注和标签的图片数据库,使其满足少样本目标检测的条件,并进行一定的数据增强扩充样本的多样性,分为联合训练数据D

【技术特征摘要】
1.一种基于知识蒸馏的少样本目标检测方法,其特征在于,该方法实现的具体操作步骤如下:
第一步:构建带有标注和标签的图片数据库,使其满足少样本目标检测的条件,并进行一定的数据增强扩充样本的多样性,分为联合训练数据Djoint和微调训练数据Dft。
第二步:选择目标检测框架和backbone网络,构建网络模型,使用联合训练数据训练网络模型,得到权重模型;方法如下:
选择Faster-RCNN作为目标检测框架,采用拥有13个卷积层、3个全连接层和5个池化层的VGG16作为backbone网络,选择优化器为SGD,在ROI池化阶段选择Align方法,使用联合训练数据Djoint训练以上模型,最终得到联合训练模型权重,称为第一权重模型;
第三步:使用微调训练数据微调步骤二得到的第一权重模型,得到新权重模型,称为第二权重模型,方法如下:
使用微调训练数据Dft训练第一权重模型,设置初始学习率,不设衰减轮次;设置训练轮次为5轮,选择优化器为SGD,在ROI池化阶段选择Align方法;冻结VGG16的所有特征层,只调整分类层;最终得到微调训练模型权重,称为第二权重模型;
第四步:将第二步得到的第一权重模型作为学生网络,第三步得到的第二权重模型作为教师网络,再次使用微调训练数据,根据教师...

【专利技术属性】
技术研发人员:杨嘉琛郭晓岚王晨光
申请(专利权)人:天津大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1