基于知识蒸馏的人体检测模型训练方法及装置制造方法及图纸

技术编号：37439766 阅读：20 留言：0更新日期：2023-05-06 09:11

本申请提供一种基于知识蒸馏的人体检测模型训练方法及装置。该方法包括：获取预训练好的教师模型，并对预设的人体检测模型的参数进行初始化，得到学生模型；将样本图像分别输入到教师模型及学生模型中，利用教师模型对应的分类分支输出第一置信度，并利用学生模型对应的分类分支输出第二置信度；基于第一置信度、第二置信度以及温度参数计算二元交叉熵损失，并依据第一置信度计算权重，利用权重计算加权后的广义交并比损失；利用二元交叉熵损失及加权后的广义交并比损失，分别对学生模型的分类分支和边界框分支进行训练，得到训练后的人体检测模型。本申请简化了基于知识蒸馏的人体检测模型的结构，提高了算法的泛化性，提升模型的蒸馏效果。模型的蒸馏效果。模型的蒸馏效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识蒸馏的人体检测模型训练方法及装置

[0001]本申请涉及计算机
，尤其涉及一种基于知识蒸馏的人体检测模型训练方法及装置。

技术介绍

[0002]目标检测算法在实际中应用广泛，其中比较常见的是人体检测算法，比如YOLOX算法，因为其高精度的检测效果，被常用在工业界，比如人体检测项目等。知识蒸馏是一种利用大模型提高小模型泛化性的手段，因为它有无损模型速度提高模型精度的优势，也已被广泛应用。然而，目标检测算法由于其任务的复杂性，导致传统的蒸馏方法在目标检测算法中很难生效。
[0003]以基于YOLOX算法的人体检测任务为例，需要同时定位人体的位置坐标以及判断是否属于人体，相对图像分类任务更加复杂，现有技术使用的基于softmax与交叉熵的蒸馏损失无法用在人体检测任务中，导致无法利用知识蒸馏来提高人体检测的泛化性。因此，现有的人体检测模型无法应用知识蒸馏的方式训练，导致人体检测模型的泛化性差，人体检测模型的检测精度降低。

技术实现思路

[0004]有鉴于此，本申请实施例提供了一种基于知识蒸馏的人体检测模型训练方法及装置，以解决现有技术存在的人体检测模型无法应用知识蒸馏的方式训练，人体检测模型的泛化性差，人体检测模型的检测精度降低的问题。
[0005]本申请实施例的第一方面，提供了一种基于知识蒸馏的人体检测模型训练方法，包括：获取预训练好的教师模型，并对预设的人体检测模型的参数进行初始化，得到学生模型；将样本图像分别输入到教师模型及学生模型中，利用教师模型对应的分类分支输出第一置信...

【技术保护点】

【技术特征摘要】
1.一种基于知识蒸馏的人体检测模型训练方法，其特征在于，包括：获取预训练好的教师模型，并对预设的人体检测模型的参数进行初始化，得到学生模型；将样本图像分别输入到所述教师模型及所述学生模型中，利用所述教师模型对应的分类分支输出第一置信度，并利用所述学生模型对应的分类分支输出第二置信度；基于所述第一置信度、所述第二置信度以及温度参数计算二元交叉熵损失，并依据所述第一置信度计算权重，利用所述权重计算加权后的广义交并比损失；利用所述二元交叉熵损失及所述加权后的广义交并比损失，分别对所述学生模型的分类分支和边界框分支进行训练，得到训练后的人体检测模型。2.根据权利要求1所述的方法，其特征在于，所述教师模型和所述学生模型中均采用人体检测模型，所述人体检测模型中包含主干模块、颈部模块和头部模块。3.根据权利要求2所述的方法，其特征在于，所述教师模型和所述学生模型的头部模块分别对应一个分类分支，所述分类分支由原始的人体检测模型的目标分支和原始分类分支合并而成。4.根据权利要求1所述的方法，其特征在于，所述利用所述教师模型对应的分类分支输出第一置信度，并利用所述学生模型对应的分类分支输出第二置信度，包括：利用所述教师模型对应的主干模块、颈部模块和头部模块依次提取第一特征图，将所述第一特征图输入到所述教师模型的头部模块对应的分类分支中，输出第一置信度；以及，利用所述学生模型对应的主干模块、颈部模块和头部模块依次提取第二特征图，将所述第二特征图输入到所述学生模型的头部模块对应的分类分支中，输出第二置信度。5.根据权利要求1所述的方法，其特征在于，所述基于所述第一置信度、所述第二置信度以及温度参数计算二元交叉熵损失，包括：将所述第一置信度和所述第二置信度分别与所...

【专利技术属性】
技术研发人员：何翔，黄泽元，
申请(专利权)人：北京龙智数科科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人