目标检测模型训练方法、检测方法、终端设备及存储介质技术

技术编号:36860503 阅读:9 留言:0更新日期:2023-03-15 18:26
本发明专利技术公开了一种目标检测模型训练方法、检测方法、终端设备及存储介质。其中,目标检测模型训练方法包括:对训练图集中的至少部分训练样本图添加对应扰动,得到对抗样本图;再采用添加有对抗样本图的训练图集对人工神经网络识别模型进行训练,得到目标检测模型。训练的过程中对抗样本图会改变模型的决策边界,使得模型能够正确区分这些对抗样本图,当邻域中的所有点都不会越过决策边界的时候,训练出来的目标检测模型就对这一邻域范围内的数据具有对抗稳健性。因此,在人工神经网络识别模型的基础上使用虚拟对抗训练的技术对结果进行数据增强,使得正确结果相邻区域的点都能被正确预测并归类,提高了目标检测模型的鲁棒性。提高了目标检测模型的鲁棒性。提高了目标检测模型的鲁棒性。

【技术实现步骤摘要】
目标检测模型训练方法、检测方法、终端设备及存储介质


[0001]本专利技术涉及图像算法领域,特别涉及一种目标检测模型训练方法、检测方法、终端设备及存储介质。

技术介绍

[0002]随着网络的普及和娱乐方式的多元化,人们从各类视频中获取的信息占到了相当大的一个比重。有时我们希望能够获得视频中的某些特定目标,例如,在视频中快速找目标对象。如果这些目标识别任务全部使用人工播放检测的方式进行会有人力成本高,时间消耗大的缺陷。因此,我们尝试应用计算机视觉领域的机器学习方法归档处理数据,最终实现机器自动检测目标并分类。
[0003]随着科技不断进步,人们对人工神经网络识别模型的鲁棒性提出了更高的要求,如何满足更高鲁棒性的要求是一个值得研究的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种目标检测模型训练方法、检测方法、终端设备及存储介质,其能够改善上述问题。
[0005]本申请的实施例是这样实现的:第一方面,本申请提供一种目标检测模型训练方法,其包括:S1、获取训练样本图,生成训练图集;S2、对所述训练图集中的至少部分所述训练样本图添加对应扰动,得到对抗样本图;S3、将所述对抗样本图加入所述训练图集,得到更新后的所述训练图集;S4、采用更新后的所述训练图集对人工神经网络识别模型进行训练,得到目标检测模型。
[0006]在本申请实施例中,步骤S1至S4为默认顺序,但是步骤S1至S4中的任意步骤顺序可以根据实际情况调换。
[0007]可以理解,本申请公开了一种目标检测模型训练方法,对训练图集中的至少部分训练样本图添加对应扰动,得到对抗样本图;再采用添加有对抗样本图的训练图集对人工神经网络识别模型进行训练,得到目标检测模型。训练的过程中对抗样本图会改变模型的决策边界,使得模型能够正确区分这些对抗样本图,当邻域中的所有点都不会越过决策边界的时候,训练出来的模型就对这一邻域范围内的数据具有对抗稳健性。因此,在人工神经网络识别模型的基础上使用虚拟对抗训练的技术对结果进行数据增强,使得正确结果相邻区域的点都能被正确预测并归类,提高了目标识别模型的鲁棒性。
[0008]在本申请可选的实施例中,步骤S2包括:S21、提取所述训练图集中的至少部分所述训练样本图作为待处理样本图;S22、通过下式快速计算出每张所述待处理样本图对应的待添加的扰动:
其中,为在所述训练样本图中每个点的周围范围,是度量和之间距离的函数,是距离函数对于r所计算的梯度,代表所述训练样本图,代表识别结果,表示所述训练样本图的预测分布,代表模型参数,是规范化后的梯度值,是梯度值,是最大特征值对应的特征向量;S23、将所述扰动添加到对应的所述训练样本图中,得到对抗样本图。
[0009]可以理解,有时图片数据会受到外界噪声,抑或特定方向的数据攻击,在人眼不可分辨的维度上做出的改变可以让深度学习网络在判断时产生较大的误差。本申请将生成的对抗样本加入到训练集中进行数据增强,训练的过程中对抗样本会改变模型的决策边界,使得模型能够正确区分这些对抗样本,当邻域中的所有点都不会越过决策边界的时候,训练出来的模型就对这一邻域范围内的数据具有对抗稳健性。本申请采用虚拟对抗训练(Visual adversarial training,VAT)技术计算扰动,虚拟对抗训练是一种应用于深度学习的半监督正则化方法,对于数据中一部分带有标签,另一部分数据不带有标签的情况更为适用。
[0010]在本申请可选的实施例中,所述人工神经网络识别模型,包括输入端、主干网络、特征融合网络和预测端。
[0011]在本申请可选的实施例中,所述输入端用于对输入图像进行Mosaic数据增强处理、自适应锚框计算处理和自适应灰度填充处理中的至少一项。
[0012]在本申请可选的实施例中,所述主干网络用于对经所述输入端处理后的图像进行特征提取处理,依次包括Focus模块、多个CBL

CSP1_X模块和SPP模块;所述Focus模块将输入图像等间距采样成四个子图;所述CBL

CSP1_X模块依次包括CBL模块和CSP1模块,其中,所述CBL模块用于通过卷积操作对输入图像进行降采样,依次包括卷积层、归一化层和激活函数,所述CSP1_X模块用于通过卷积操作对输入图像进行特征提取,所述CSP1_X模块对输入图像进行所述CBL模块、多个残差堆叠模块和卷积层处理后再与卷积后的所述CSP1_X模块的输入图像进行拼接;所述SPP模块用于使用多种最大池化将不同尺寸的空间特征信息进行拼接,得到第一目标特征图。
[0013]在本申请可选的实施例中,所述特征融合网络用于对输入的第一目标特征图进行叠加操作和拼接操作,包括FPN模块、PAN模块和CSP2_X

CBL模块;所述FPN模块自顶向下进行上采样,所述PAN模块自底向上进行下采样;所述CSP2_X

CBL模块包括依次包括CSP2_X模块和CBL模块,其中,所述CSP2_X模块对输入图像进行多个所述CBL模块和卷积层处理后再与卷积后的所述CSP2_X模块的输入图像进行拼接。
[0014]在本申请可选的实施例中,所述预测端用于根据所述特征融合网络输出的第二目标特征图做出预测;所述预测端采用下式计算预测框的损失函数:,
其中,代表所述预测框的损失函数,即衡量所述预测框与真实框重合程度的指标,代表预测框和真实框的交并比,和分别表示预测框和真实框中心点的欧氏距离和最小外接矩形的对角线长度;其中,代表衡量所述预测框长宽比一致性的参数:,是真实框的宽,是真实框的高,是预测框的宽,是预测框的高,代表所述真实框的宽高比,代表所述预测框的宽高比。
[0015]第二方面,本申请提供一种目标检测模型检测方法,包括:获取待检测图像;将所述待检测图像输入所述目标检测模型,得到所述待检测图像中的所有图像元素识别结果。
[0016]可以理解,本申请公开了一种目标检测模型检测方法,采用第一方面公开的目标检测模型进行图像识别,由于其具有较好的鲁棒性,对于识别结果更加精准。
[0017]第三方面,本申请公开了一种终端设备,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如第一方面和第二方面任一项所述的方法。
[0018]第四方面,本申请公开了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如第一方面和第二方面任一项所述的方法。
[0019]有益效果:本申请公开了一种目标检测模型训练方法,对训练图集中的至少部分训练样本图添加对应扰动,得到对抗样本图;再采用添加有对抗样本图的训练图集对人工神经网络识别模型进行训练,得到目标检测模型。训练的过程中对抗样本图会改变模型的决策边界,使得模型能够正确区分这些对抗样本图,当邻域中的所有点都不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.目标检测模型训练方法,其特征在于,包括:获取训练样本图,生成训练图集;对所述训练图集中的至少部分所述训练样本图添加对应扰动,得到对抗样本图;将所述对抗样本图加入所述训练图集,得到更新后的所述训练图集;采用更新后的所述训练图集对人工神经网络识别模型进行训练,得到目标检测模型。2.根据权利要求1所述的目标检测模型训练方法,其特征在于,所述对所述训练图集中的至少部分所述训练样本图添加对应扰动,得到对抗样本图,包括:提取所述训练图集中的至少部分所述训练样本图作为待处理样本图;通过下式快速计算出每张所述待处理样本图对应的待添加的扰动:其中,为在所述训练样本图中每个点的周围范围,是度量和之间距离的函数, 是距离函数对于r所计算的梯度,代表所述训练样本图,代表识别结果,表示所述训练样本图的预测分布,代表模型参数,是规范化后的梯度值, 是梯度值,是最大特征值对应的特征向量;将所述扰动添加到对应的所述训练样本图中,得到对抗样本图。3.根据权利要求2所述的目标检测模型训练方法,其特征在于,所述人工神经网络识别模型包括输入端、主干网络、特征融合网络和预测端。4.根据权利要求3所述的目标检测模型训练方法,其特征在于,所述输入端用于对输入图像进行Mosaic数据增强处理、自适应锚框计算处理和自适应灰度填充处理中的至少一项。5.根据权利要求4所述的目标检测模型训练方法,其特征在于,所述主干网络用于对经所述输入端处理后的图像进行特征提取处理,依次包括Focus模块、多个CBL

CSP1_X模块和SPP模块;所述Focus模块将输入图像等间距采样成四个子图;所述CBL

CSP1_X模块依次包括CBL模块和CSP1模块,其中,所述CBL模块用于通过卷积操作对输入图像进行降采样,依次包括卷积层、归一化层和激活函数,所述CSP1_X模块用于通过卷积操作对输入图像进行特征提取,所述CSP1_X模块对输入图像进行所述CBL模块、多个残差堆叠模块和卷积层处理后再与卷积后的...

【专利技术属性】
技术研发人员:贺玉彬宋廖超刘金全
申请(专利权)人:国能大渡河大数据服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1