一种检测模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34929981 阅读:20 留言:0更新日期:2022-09-15 07:25
本申请公开了一种检测模型的训练方法、装置、电子设备及存储介质。包括:首先从监控视频中提取目标视频帧图像,并将标注信息携带在目标视频帧图像。得到样本图像;利用样本图像训练无锚框的深度学习网络模型,以使深度学习网络模型中的主干网络层从样本图像中提取图像特征,基于图像特征生成特征图,通过预测层中的解耦头基于特征图输出目标对象的预测位置信息;如果预测位置信息满足预设条件,即得到检测模型。本申请在预测层中加入解耦头能够提高深度学习网络模型的检测速度和精度。同时在训练过程中没有锚框,所以不需要计算锚框和边界框之间的交并比来获得样本图像。因此可以直接利用携带标注信息的样本图像训练模型,提高了模型的训练效率。了模型的训练效率。了模型的训练效率。

【技术实现步骤摘要】
一种检测模型的训练方法、装置、电子设备及存储介质


[0001]本申请涉及图像处理
,尤其涉及一种检测模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]目标检测已被广泛研究,用于定位图像中的目标并将目标分类为许多不同类别中的一种。随着深度学习的日益成功,深度学习模型已经成为目标检测领域的研究热点。
[0003]在现有的技术中,基于区域提名的方法占据上风,但是这类方法过程一般都比较复杂,即先对原始图像进行提取候选框操作,再把候选框缩放为固定大小并进行特征提取,最后得到检测结果。虽然这种方法得到的结果精度很高,但是速度慢,实时效果差。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种检测模型的训练方法、装置、电子设备及存储介质。
[0005]根据本申请实施例的一个方面,提供了一种检测模型的训练方法,包括:
[0006]获取对目标厂房进行监控得到的监控视频,并从所述监控视频中提取多个目标视频帧图像,其中,所述目标视频帧图像中包括至少一个目标对象;
[0007]将获取的标签信息携带于所述目标视频帧图像,得到样本图像,其中,所述标签信息用于标注所述目标对象在所述视频帧图像中的实际位置信息;
[0008]利用所述样本图像训练无锚框的深度学习网络模型,以使所述深度学习网络模型中的主干网络层从所述样本图像中提取图像特征,基于所述图像特征生成目标特征图,将所述目标特征图传递至预测层,通过所述预测层基于所述目标特征图进行预测,得到所述目标对象的预测位置信息;
[0009]确定所述预测位置信息与实际位置信息之间的匹配度,在所述匹配度落入预设范围的情况下,将所述深度学习网络模型确定为检测模型。
[0010]进一步的,所述从所述监控视频中提取多个目标视频帧图像,包括:
[0011]提取所述监控视频所包括的视频帧图像;
[0012]检测所述视频帧图像的完整程度;
[0013]将所述完整程度满足预设完整程度的视频帧图像确定为所述目标帧图像。
[0014]进一步的,所述方法还包括:
[0015]将所述目标帧图像按照第一预设比例生成训练集合,以及按照第二预设比例生成测试集合,其中,所述第一预设比例大于所述第二预设比例。
[0016]进一步的,所述深度学习网络模型包括:顺次连接的主干网络层、瓶颈层以及预测层,所述预测层包括:解耦头以及检测器,所述解耦头包括:分类头、目标头以及位置头。
[0017]进一步的,所述利用所述样本图像训练无锚框的深度学习网络模型,以使所述深度学习网络模型中的主干网络层从所述样本图像中提取图像特征,基于所述图像特征生成
目标特征图,将所述目标特征图传递至预测层,通过所述预测层基于所述目标特征图进行预测,得到所述目标对象的预测位置信息,包括:
[0018]将所述样本图像输入所述深度学习网络模型,通过所述主干网络层从所述样本图像中提取初始图像特征,并将所述初始图像特征传递至所述瓶颈层;
[0019]通过所述瓶颈层对所述初始图像特征进行上采样处理,得到高层图像特征,并融合所述高层图像特征,得到目标特征图,将所述目标特征图传递至所述预测层;
[0020]通过所述预测层基于所述目标特征图进行预测,得到包围所述目标对象的预测框,并利用所述预测框的坐标确定所述预测位置信息。
[0021]进一步的,所述通过所述预测层基于所述目标特征图进行预测,得到包围所述目标对象的预测框,并利用所述预测框的坐标确定所述预测位置信息,包括:
[0022]通过所述预测层的分类头确定所述目标特征图中预测框的类别,以及类别对应的类别分数,通过所述预测层中的目标头从所述目标特征图中获取与实际目标框相匹配的预测框作为前景特征,以及通过所述预测层中的位置头从所述目标特征图中得到所述预测框的初始坐标;
[0023]通过所述检测器对所述预测框对应的类别及类别分数、前景特征以及所述预测框的初始坐标进行融合拼接,得到所述预测位置信息。
[0024]进一步的,所述方法还包括:
[0025]在所述匹配度落入预设范围的情况下,利用所述测试集合中的目标视频帧图像对所述深度学习网络模型进行测试,得到测试结果;
[0026]在所述测试结果满足预设测试结果的情况下,将所述深度学习网络模型确定为检测模型。
[0027]根据本申请实施例的另一方面,还提供了一种检测模型的训练装置,包括:
[0028]获取模块,用于获取对目标厂房进行监控得到的监控视频,并从所述监控视频中提取多个目标视频帧图像,其中,所述目标视频帧图像中包括至少一个目标对象;
[0029]标注模块,用于将获取的标签信息携带于所述目标视频帧图像,得到样本图像,其中,所述标签信息用于标注所述目标对象在所述视频帧图像中的实际位置信息;
[0030]处理模块,用于利用所述样本图像训练无锚框的深度学习网络模型,以使所述深度学习网络模型中的主干网络层从所述样本图像中提取图像特征,基于所述图像特征生成目标特征图,将所述目标特征图传递至预测层,通过所述预测层基于所述目标特征图进行预测,得到所述目标对象的预测位置信息;
[0031]确定模块,用于确定所述预测位置信息与实际位置信息之间的匹配度,在所述匹配度落入预设范围的情况下,将所述深度学习网络模型确定为检测模型。
[0032]根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。
[0033]根据本申请实施例的另一方面,还提供了一种电子装置,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。
[0034]本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行
时,使得计算机执行上述方法中的步骤。
[0035]本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请在预测层中加入解耦头能够提高深度学习网络模型的检测速度和精度。同时在训练过程中没有锚框,所以不需要计算预测框和目标框之间的交并比来获得样本图像。因此可以直接利用携带标注信息的样本图像训练模型,提高了模型的训练效率。
附图说明
[0036]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0037]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本申请实施例提供的一种检测模型的训练方法的流程图;
[0039]图2为本申请实施例提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检测模型的训练方法,其特征在于,包括:获取对目标厂房进行监控得到的监控视频,并从所述监控视频中提取多个目标视频帧图像,其中,所述目标视频帧图像中包括至少一个目标对象;将获取的标签信息携带于所述目标视频帧图像,得到样本图像,其中,所述标签信息用于标注所述目标对象在所述视频帧图像中的实际位置信息;利用所述样本图像训练无锚框的深度学习网络模型,以使所述深度学习网络模型中的主干网络层从所述样本图像中提取图像特征,基于所述图像特征生成目标特征图,将所述目标特征图传递至预测层,通过所述预测层基于所述目标特征图进行预测,得到所述目标对象的预测位置信息;确定所述预测位置信息与实际位置信息之间的匹配度,在所述匹配度落入预设范围的情况下,将所述深度学习网络模型确定为检测模型。2.根据权利要求1所述的方法,其特征在于,所述从所述监控视频中提取多个目标视频帧图像,包括:提取所述监控视频所包括的视频帧图像;检测所述视频帧图像的完整程度;将所述完整程度满足预设完整程度的视频帧图像确定为所述目标帧图像。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述目标帧图像按照第一预设比例生成训练集合,以及按照第二预设比例生成测试集合,其中,所述第一预设比例大于所述第二预设比例。4.根据权利要求3所述的方法,其特征在于,所述深度学习网络模型包括:顺次连接的主干网络层、瓶颈层以及预测层,所述预测层包括:解耦头以及检测器,所述解耦头包括:分类头、目标头以及位置头。5.根据权利要求4所述的方法,其特征在于,所述利用所述样本图像训练无锚框的深度学习网络模型,以使所述深度学习网络模型中的主干网络层从所述样本图像中提取图像特征,基于所述图像特征生成目标特征图,将所述目标特征图传递至预测层,通过所述预测层基于所述目标特征图进行预测,得到所述目标对象的预测位置信息,包括:将所述样本图像输入所述深度学习网络模型,通过所述主干网络层从所述样本图像中提取初始图像特征,并将所述初始图像特征传递至所述瓶颈层;通过所述瓶颈层对所述初始图像特征进行上采样处理,得到高层图像特征,并融合所述高层图像特征,得到目标特征图,将所述目标特征图传递至所述预测层;通过所述预测层基于所述目标特征图进行预测,得到包围所述目标对象的预测框,并利用所述预测框的坐...

【专利技术属性】
技术研发人员:尹继尧周琳陈文江
申请(专利权)人:城市安全发展科技研究院深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1