一种检测模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：34929981 阅读：20 留言：0更新日期：2022-09-15 07:25

本申请公开了一种检测模型的训练方法、装置、电子设备及存储介质。包括：首先从监控视频中提取目标视频帧图像，并将标注信息携带在目标视频帧图像。得到样本图像；利用样本图像训练无锚框的深度学习网络模型，以使深度学习网络模型中的主干网络层从样本图像中提取图像特征，基于图像特征生成特征图，通过预测层中的解耦头基于特征图输出目标对象的预测位置信息；如果预测位置信息满足预设条件，即得到检测模型。本申请在预测层中加入解耦头能够提高深度学习网络模型的检测速度和精度。同时在训练过程中没有锚框，所以不需要计算锚框和边界框之间的交并比来获得样本图像。因此可以直接利用携带标注信息的样本图像训练模型，提高了模型的训练效率。了模型的训练效率。了模型的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种检测模型的训练方法、装置、电子设备及存储介质

[0001]本申请涉及图像处理
，尤其涉及一种检测模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]目标检测已被广泛研究，用于定位图像中的目标并将目标分类为许多不同类别中的一种。随着深度学习的日益成功，深度学习模型已经成为目标检测领域的研究热点。
[0003]在现有的技术中，基于区域提名的方法占据上风，但是这类方法过程一般都比较复杂，即先对原始图像进行提取候选框操作，再把候选框缩放为固定大小并进行特征提取，最后得到检测结果。虽然这种方法得到的结果精度很高，但是速度慢，实时效果差。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题，本申请提供了一种检测模型的训练方法、装置、电子设备及存储介质。
[0005]根据本申请实施例的一个方面，提供了一种检测模型的训练方法，包括：
[0006]获取对目标厂房进行监控得到的监控视频，并从所述监控视频中提取多个目标视频帧图像，其中，所述目标视频帧图像中包括至少一个目标对象；
[0007]将获取的标签信息携带于所述目标视频帧图像，得到样本图像，其中，所述标签信息用于标注所述目标对象在所述视频帧图像中的实际位置信息；
[0008]利用所述样本图像训练无锚框的深度学习网络模型，以使所述深度学习网络模型中的主干网络层从所述样本图像中提取图像特征，基于所述图像特征生成目标特征图，将所述目标特征图传递至预测层，通过所述预测层基于所述目标特征图...

【技术保护点】

【技术特征摘要】
1.一种检测模型的训练方法，其特征在于，包括：获取对目标厂房进行监控得到的监控视频，并从所述监控视频中提取多个目标视频帧图像，其中，所述目标视频帧图像中包括至少一个目标对象；将获取的标签信息携带于所述目标视频帧图像，得到样本图像，其中，所述标签信息用于标注所述目标对象在所述视频帧图像中的实际位置信息；利用所述样本图像训练无锚框的深度学习网络模型，以使所述深度学习网络模型中的主干网络层从所述样本图像中提取图像特征，基于所述图像特征生成目标特征图，将所述目标特征图传递至预测层，通过所述预测层基于所述目标特征图进行预测，得到所述目标对象的预测位置信息；确定所述预测位置信息与实际位置信息之间的匹配度，在所述匹配度落入预设范围的情况下，将所述深度学习网络模型确定为检测模型。2.根据权利要求1所述的方法，其特征在于，所述从所述监控视频中提取多个目标视频帧图像，包括：提取所述监控视频所包括的视频帧图像；检测所述视频帧图像的完整程度；将所述完整程度满足预设完整程度的视频帧图像确定为所述目标帧图像。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：将所述目标帧图像按照第一预设比例生成训练集合，以及按照第二预设比例生成测试集合，其中，所述第一预设比例大于所述第二预设比例。4.根据权利要求3所述的方法，其特征在于，所述深度学习网络模型包括：顺次连接的主干网络层、瓶颈层以及预测层，所述预测层包括：解耦头以及检测器，所述解耦头包括：分类头、目标头以及位置头。5.根据权利要求4所述的方法，其特征在于，所述利用所述样本图像训练无锚框的深度学习网络模型，以使所述深度学习网络模型中的主干网络层从所述样本图像中提取图像特征，基于所述图像特征生成目标特征图，将所述目标特征图传递至预测层，通过所述预测层基于所述目标特征图进行预测，得到所述目标对象的预测位置信息，包括：将所述样本图像输入所述深度学习网络模型，通过所述主干网络层从所述样本图像中提取初始图像特征，并将所述初始图像特征传递至所述瓶颈层；通过所述瓶颈层对所述初始图像特征进行上采样处理，得到高层图像特征，并融合所述高层图像特征，得到目标特征图，将所述目标特征图传递至所述预测层；通过所述预测层基于所述目标特征图进行预测，得到包围所述目标对象的预测框，并利用所述预测框的坐...

【专利技术属性】
技术研发人员：尹继尧，周琳，陈文江，
申请(专利权)人：城市安全发展科技研究院深圳，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人