【技术实现步骤摘要】
基于迁移学习的人物检测方法和系统
[0001]本专利技术涉及目标检测和迁移学习中知识蒸馏
,并特别涉及一种基于迁移学习的人物检测方法、系统、存储介质和客户端。
技术介绍
[0002]近年来,大规模的深度模型取得了巨大的成功,但巨大的计算复杂度和海量的存储需求使得将它们部署在资源有限的设备中是一个巨大的挑战。作为一种模型压缩和加速方法,知识蒸馏通过转移来自教师检测器的暗知识,即教师网络中隐含的对学生网络中有用的信息,进而有效地提高了小模型的性能。现有大多数基于知识蒸馏的目标检测方法主要让学生网络去模仿老师网络中与边界框重叠的特征,并认为从bounding box中选择的前景特征很重要。
[0003]现有的目标检测中知识蒸馏方法过分注重bounding box区域的信息,而忽视了其他的区域的有用信息。首先,从bounding box中选出的前景特征只包含数据集中的类别,而忽略了数据集外对象的类别,导致遗漏了一些重要的特征。例如,COCO数据集中不包含人体模特类别,但包含人物类别。由于模特在视觉上与人相似,人体模型的 ...
【技术保护点】
【技术特征摘要】
1.一种基于迁移学习的人物检测方法,其特征在于,包括:步骤1、构建用于图像目标检测的教师网络和其对应的学生网络,获取已标注人物类别标签的图片数据集作为训练数据集;步骤2、以该训练数据集对该教师网络和该学生网络进行训练时,提取老师网络每层目标检测FPN的分类分支输出,得到包括NCHW四个通道输出结果的四维矩阵;步骤3、通过在该四维矩阵的C通道方向求和,得到NHW维度的特征矩阵作为特征掩码矩阵,基于该特征掩码矩阵、老师网络和学生网络的FPN特征图,得到特征图约束损失;步骤4、对教师网络的损失、学生网络的损失和该特征图约束损失进行求和,得到蒸馏损失。步骤5、重复迭代执行该步骤2到该步骤4,直到该蒸馏损失收敛或达到预设重复迭代次数,终止训练,将当前学生网络作为人物检测模型,并使用该人物检测模型对图片中的人物进行检测。2.如权利要求1所述的基于迁移学习的人物检测方法,其特征在于,该步骤2包括:分别根据老师网络和学生网络每层目标检测FPN中特征包含的目标对象信息量,得到老师网络每层目标检测FPN的老师特征丰富度得分和学生网络每层目标检测FPN的学生特征丰富度得分;该步骤3包括:基于该老师特征丰富度得分和该学生特征丰富度得分,得到分类头约束损失;该步骤4包括:对教师网络的损失、学生网络的损失、该特征图约束损失和该分类头约束损失进行求和,得到该蒸馏损失。3.如权利要求1所述的基于迁移学习的人物检测方法,其特征在于,该特征图约束损失:式中M代表FPN的总层数,W,H分别代表特征图的宽度和高度,l为对应FPN的层数,i,j代表特征图上点的坐标;表特征图上点的坐标;分别代表着老师网络和学生网络第L层对应的FPN特征图,φ
adapt
为自适应卷积层。4.如权利要求2所述的基于迁移学习的人物检测方法,其特征在于,该分类头约束损失:式中M代表FPN的层数,W,H代表特征图的宽度和高度,式中M代表FPN的层数,W,H代表特征图的宽度和高度,式中M代表FPN的层数,W,H代表特征图的宽度和高度,分别代表着老师网络和学生网络第l层对应的老师特征丰富度得分和学生特征丰富度得分,φ为二进制交叉熵函数。5.一种基于迁移学习的人物检测系统,其特征在于,包括:
模块1,用于构建用于图像目标检测的教师网络...
【专利技术属性】
技术研发人员:张蕊,杜治兴,常明,张曦珊,刘少礼,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。