【技术实现步骤摘要】
轻量化车辆检测模型构建方法、系统及装置
本专利技术涉及人工智能
,尤其是涉及一种轻量化车辆检测模型构建方法、系统及装置。
技术介绍
在深度学习技术出现之前,计算机视觉任务主要采用传统的手工特征结合分类器方法进行物体识别和检测,这些传统的机器学习方法存在速度较慢、精度较低等问题。随着深度学习技术的研究日趋成熟,加上互联网中积累的海量多媒体数据和各种计算设备的计算能力不断提升,从而可以将深度学习技术应用在计算机视觉任务上,并取得很好的效果。现在目标检测、物体分类、目标追踪等计算机视觉任务主流的方法都是基于深度学习的,速度和精度远超传统的方法,能在实际场景中得到应用。目标检测任务是计算机视觉中一个热门且重要的研究领域,其定义为从图像、视频等多媒体资源中,识别其中存在的物体的类别(分类)和对应在图片或视频中的位置(定位)。在深度学习出现之前,传统的目标检测是基于人工定义的特征和采用浅层的模型框架,面对复杂图像的检测时会遇到性能和准确性的瓶颈。传统的目标检测方法通常分为3个步骤,分别为区域选取、特征提取和分类。在图像的区 ...
【技术保护点】
1.一种基于深度学习的轻量化车辆检测模型构建方法,其特征在于,包括:/n在主干网络为EfficientNet的目标检测算法EfficientDet模型的双向特征金字塔模块的末端增加轻量化的通道注意力模块,通过所述通道注意力模块以一定步长的一维卷积学习到不同通道之间的特征图的关系;/n采用自适应训练样本选择算法进行正负样例选择,对所述EfficientDet模型进行训练;/n采用蒸馏学习方法在原有的数据集使用大模型训练一个高精度的模型,随后对训练好的大模型进行压缩构建一个更小的模型,并使用大模型作为教师网络指导小模型进行中间特征层的蒸馏学习、目标分类结果的蒸馏学习以及目标框回 ...
【技术特征摘要】
1.一种基于深度学习的轻量化车辆检测模型构建方法,其特征在于,包括:
在主干网络为EfficientNet的目标检测算法EfficientDet模型的双向特征金字塔模块的末端增加轻量化的通道注意力模块,通过所述通道注意力模块以一定步长的一维卷积学习到不同通道之间的特征图的关系;
采用自适应训练样本选择算法进行正负样例选择,对所述EfficientDet模型进行训练;
采用蒸馏学习方法在原有的数据集使用大模型训练一个高精度的模型,随后对训练好的大模型进行压缩构建一个更小的模型,并使用大模型作为教师网络指导小模型进行中间特征层的蒸馏学习、目标分类结果的蒸馏学习以及目标框回归预测的结果蒸馏学习,得到最终的轻量化车辆检测模型。
2.根据权利要求1所述的方法,其特征在于,通过所述通道注意力模块以一定步长的一维卷积学习到不同通道之间的特征图的关系具体包括:
通过所述通道注意力模块,使用全局平均池化将输入的C维特征图变成1*1*C的向量,接着进行卷积核大小为k的一维卷积,再通过Sigmoid函数输出学习到的各个通道的权重,最后使用学到的权重和原来输入的特征图进行相乘。
3.根据权利要求1所述的方法,其特征在于,采用自适应训练样本选择算法进行正负样例选择,对所述EfficientDet模型进行训练具体包括:
采用自适应训练样本选择算法对于图片中的每个groundtruth先筛选出候选的正例anchor,对参与目标预测的特征金字塔中每一个特征图的anchor计算其中心点到groundtruth中心点的欧氏距离,每一个特征图选取中心点距离最近的前k个anchor组成该groundtruth的候选正例anchor集合;
计算候选正例集合中每个anchor和groundtruth的IoU,以计算出候选正例anchor中的IoU的均值和标准差;
将IoU的均值和标准差相加作为判定anchor是否为正例的阈值,候选正例中的anchor的IoU大于阈值则设为正例,否则设为负例,如果一个anchor同时被分配多个groundtruth,则将IoU最大的groundtruth作为最终的分配目标;
最后将中心点不在groundtruth内的anchor设为负例,进行正负样例选择;
将所述正负样例输入到所述EfficientDet模型进行训练。
4.根据权利要求1所述的方法,其特征在于,并使用大模型作为教师网络指导小模型进行中间特征层的蒸馏学习、目标分类结果的蒸馏学习以及目标框回归预测的结果蒸馏学习具体包括:
进行中间特征层的蒸馏学习:
对于一个中间特征层计算每一个groundtruth和中间特征层中所有anchor的IoU,形成W*H*K的IoU矩阵记为m,其中,K为一个特征点对应的anchor的数量;W为中间特征层的宽,H为为中间特征层的高;
计算IoU矩阵中最大的IoU值记为M=max(m),再相乘一个阈值系数ψ得到对应IoU阈值F=ψ*M,大于IoU阈值对应的anchor所在特征点将被选中为需要蒸馏学习的特征点,将其组合成一个W×H标记矩阵,对应为在一个中间特征层上对某groundtruth需要学习的特征点的对应位置标记矩阵;
最后遍历所有的groundtruth执行上述的同样操作,最终得到该中间特征层在groundtruth附近需要学习的特征点的标记矩阵;
在小模型的中间特征层后面设置一个中间适配层,通过3×3的二维卷积操作使小模型的特征层通道数和大网络的中间特征层通道数变成一致;
根据公式1和公式2进行中间特征层蒸馏学习:
其中,Limitation-featuremap表示小模型中间特征层经过适配层后的特征点与大模型的中间特征层对应的特征点的欧式距离,Np表示矩阵中需要学习的特征点,i表示特征层中需要学习特征点的横坐标,j表示特征层中需要学习特征点的纵坐标,c表示对应的通道数,Iij表示特征层中需要学习的特征点,fadap(s)ijc表示小模型中间特征层经过适配层后的特征点,tijc表示大模型的中间特征层对应的特征点;
进行目标分类结果的蒸馏学习:
采用如公式3和公式4所述的目标分类蒸馏损失函数,对于大模型和小模型中的分类分支输出的结果,在训练过程中使用KL散度使小模型输出的分类结果的分布向大网络输出的分类结果分布靠近;
Limitation-cls=(1-e-KL)γ×KL公式4;
其中,T和S分别对应大模型和小模型,而q和p对应大模型能够和小模型预测类别的概率,(1-e-KL)γ为权重系数,γ为调制系数,用于调整易分类样本产生的loss的权重系数;
进行目标框回归预测的结果蒸馏学习:
根据公式5确定的坐标回归损失函数,将大模型预测的目标位置作为小模型预测坐标位置实现的上限,当小模型预测的位置质量比大模型预测的位置质量差的时候,则额外添加一个小模型预测坐标和真实目标坐标之间的回归损失值,使小网络预测的坐标进一步靠近真实值,如果小网络预测的位置质量高于大网络,则不需要额外添加目标坐标回归的损失值:
其中,y为真实目标的坐标,Rs为小模型预测的坐标,Rt为大模型预测的坐标。
5.一种基于深度学习的轻量化车辆检测模型构建系统,其特征在于,包括:
通道注意力构建模块,用于在主干网络为EfficientNet的目标检测算法Efficien...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。