一种基于深度IoU网络的目标检测方法、装置、设备及介质制造方法及图纸

技术编号:37677525 阅读:12 留言:0更新日期:2023-05-26 04:43
本申请公开了一种基于深度IoU网络的目标检测方法、装置、设备及介质,涉及目标检测领域,包括:对输入图像进行特征提取,并通过预设特征图处理模块进行处理,以得到处理后特征图;对处理后特征图进行预测,以获得相应的特征信息,基于预设交并比预测层生成处理后特征图中若干预测边界框相关的交并比值;基于交并比值以及预获取数据确定深度IoU网络的网络损失,并利用网络损失训练深度IoU网络,以便利用训练后网络输出包含准确边界框的输出图像;对输出图像进行测试,以便对所述输出图像中的准确边界框进行过滤与聚合,得到与输入图像对应的目标图像。这样一来,可以通过引入预设特征图处理模块实现对密集场景中微小对象边界框的精确检测。的精确检测。的精确检测。

【技术实现步骤摘要】
一种基于深度IoU网络的目标检测方法、装置、设备及介质


[0001]本专利技术涉及目标检测领域,特别涉及一种基于深度IoU网络的目标检测方法、装置、设备及介质。

技术介绍

[0002]随着深度神经网络可用性的普及,机器视觉目标检测领域取得了显著的进展,深度神经网络结合了丰富的特征表示以及用于预训练代表性模型的大规模数据库。现有技术中,虽然深度检测器的效率很高,但通常需要大量的标记数据才能从每个特定场景中学习。当需要大量注释时,密集场景下的目标检测就会出现问题。首先,场景中的目标数量多,尺寸小,且外形相似,已有的检测器无法从小型对象中提取足够的信息来识别它们。其次,目标之间的位置相近,导致输出的边界框有大量的重叠,且一个边界框中可能包含多个目标,检测效果较差。如何实现对钢筋等微小对象的边界框的精确检测成为了工业应用亟待解决的关键问题。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种基于深度IoU网络的目标检测方法、装置、设备及介质,可以通过引入预设特征图处理模块实现对密集场景中微小对象边界框的精确检测。其具体方案如下:第一方面,本申请公开了一种基于深度IoU网络的目标检测方法,包括:通过预设检测器网络对输入图像进行特征提取,并通过所述预设检测器网络中的预设特征图处理模块对经过特征提取得到的多尺度特征图进行处理,以得到包含若干预测边界框的处理后特征图;对所述处理后特征图进行预测,以获得与所述若干预测边界框对应的特征信息,并基于预设交并比预测层生成所述若干预测边界框相关的交并比值;基于所述交并比值以及预获取数据确定深度IoU网络的网络损失,并利用所述网络损失训练所述深度IoU网络,以便利用训练后网络输出与所述输入图像对应的包含准确边界框的输出图像;利用预设聚合层对所述输出图像进行测试,以便对所述输出图像中的所述准确边界框进行过滤与聚合,得到与所述输入图像对应的目标图像。
[0004]可选的,所述通过预设检测器网络对输入图像进行特征提取,并通过所述预设检测器网络中的预设特征图处理模块对经过特征提取得到的多尺度特征图进行处理,以得到包含若干预测边界框的处理后特征图,包括:通过预设检测器网络中的检测头预设若干不同anchor,以便基于所述若干不同anchor对输入图像进行特征提取,以得到多尺度特征图;所述特征提取操作包括卷积操作,池化操作;将所述多尺度特征图输入至所述预设检测器网络中的预设特征图处理模块,以便
通过预设处理规则对所述多尺度特征图进行处理,以得到包含若干预测边界框的处理后特征图。
[0005]可选的,所述通过预设处理规则对所述多尺度特征图进行处理,以得到包含若干预测边界框的处理后特征图,包括:依次利用归一化层、多头注意模块、随机失活层、所述归一化层、前馈神经网络、所述随机失活层对所述多尺度特征图进行处理,以得到包含若干预测边界框的所述处理后特征图。
[0006]可选的,所述对所述处理后特征图进行预测,以获得与所述若干预测边界框对应的特征信息,包括:利用所述检测头为所述预测边界框生成回归输出坐标;所述回归输出坐标包括所述预测边界框的中心坐标与所述边界框的高度与宽度;通过所述预设检测器网络中的分类头生成网络输出置信度与表示有无检测目标的标签。
[0007]可选的,所述基于深度IoU网络的目标检测方法,还可以包括:获取历史训练数据中的若干真实边界框,并确定标准交叉熵损失以及欧氏距离损失。
[0008]可选的,所述基于所述交并比值以及预获取数据确定深度IoU网络的网络损失,包括:基于所述交并比值、所述网络输出置信度生成目标交叉熵;所述交并比值通过所述若干真实边界框以及所述若干预测边界框确定;利用所述目标交叉熵、所述标准交叉熵损失以及所述欧氏距离损失确定深度IoU网络的网络损失。
[0009]可选的,所述利用预设聚合层对所述输出图像进行测试,以便对所述输出图像中的所述准确边界框进行过滤与聚合,得到与所述输入图像对应的目标图像,包括:将所述预测边界框转化为混合高斯分布,并对所述准确边界框中发生重叠以及置信度低于预设置信度阈值的边界框进行过滤,以得到若干过滤后边界框;将所述过滤后边界框转化为过滤后高斯分布,并利用EM算法对所述过滤后高斯分布进行处理,以便所述过滤后高斯分布与所述混合高斯分布之间的相对熵小于预设相对熵阈值,并输出与所述输入图像对应的目标图像。
[0010]第二方面,本申请公开了一种基于深度IoU网络的目标检测装置,包括:图像处理模块,用于通过预设检测器网络对输入图像进行特征提取,并通过所述预设检测器网络中的预设特征图处理模块对经过特征提取得到的多尺度特征图进行处理,以得到包含若干预测边界框的处理后特征图;参数生成模块,用于对所述处理后特征图进行预测,以获得与所述若干预测边界框对应的特征信息,并基于预设交并比预测层生成所述若干预测边界框相关的交并比值;图像输出模块,用于基于所述交并比值以及预获取数据确定深度IoU网络的网络损失,并利用所述网络损失训练所述深度IoU网络,以便利用训练后网络输出与所述输入图像对应的包含准确边界框的输出图像;图像测试模块,用于利用预设聚合层对所述输出图像进行测试,以便对所述输出
图像中的所述准确边界框进行过滤与聚合,得到与所述输入图像对应的目标图像。
[0011]第三方面,本申请公开了一种电子设备,包括:存储器,用于保存计算机程序;处理器,用于执行所述计算机程序以实现如前述的基于深度IoU网络的目标检测方法。
[0012]第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现如前述的基于深度IoU网络的目标检测方法。
[0013]本申请中,首先通过预设检测器网络对输入图像进行特征提取,并通过所述预设检测器网络中的预设特征图处理模块对经过特征提取得到的多尺度特征图进行处理,以得到包含若干预测边界框的处理后特征图,并对所述处理后特征图进行预测,以获得与所述若干预测边界框对应的特征信息,并基于预设交并比预测层生成所述若干预测边界框相关的交并比值,然后基于所述交并比值以及预获取数据确定深度IoU网络的网络损失,并利用所述网络损失训练所述深度IoU网络,以便利用训练后网络输出与所述输入图像对应的包含准确边界框的输出图像,最后利用预设聚合层对所述输出图像进行测试,以便对所述输出图像中的所述准确边界框进行过滤与聚合,得到与所述输入图像对应的目标图像。由此可见,本申请中可以在对输入图像进行特征提取得到多尺度特征图后,再通过预设的特征图处理模块对多尺度特征图进行处理,以便得到包含若干预测边界框的处理后特征图,生成所述若干预测边界框相关的交并比值,基于所述交并比值确定深度IoU网络的网络损失,并利用所述网络损失训练所述深度IoU网络,以便输出包含准确边界框的输出图像,对所述输出图像进行测试,对图像中的边界框进行过滤与聚合,以得到目标图像。这样一来,可以通过引入预设特征图处理模块实现对密集场景中微小对象边界框的精确检测。
附图说明
[0014]为了更清楚地说明本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度IoU网络的目标检测方法,其特征在于,包括:通过预设检测器网络对输入图像进行特征提取,并通过所述预设检测器网络中的预设特征图处理模块对经过特征提取得到的多尺度特征图进行处理,以得到包含若干预测边界框的处理后特征图;对所述处理后特征图进行预测,以获得与所述若干预测边界框对应的特征信息,并基于预设交并比预测层生成所述若干预测边界框相关的交并比值;基于所述交并比值以及预获取数据确定深度IoU网络的网络损失,并利用所述网络损失训练所述深度IoU网络,以便利用训练后网络输出与所述输入图像对应的包含准确边界框的输出图像;利用预设聚合层对所述输出图像进行测试,以便对所述输出图像中的所述准确边界框进行过滤与聚合,得到与所述输入图像对应的目标图像。2.根据权利要求1所述的基于深度IoU网络的目标检测方法,其特征在于,所述通过预设检测器网络对输入图像进行特征提取,并通过所述预设检测器网络中的预设特征图处理模块对经过特征提取得到的多尺度特征图进行处理,以得到包含若干预测边界框的处理后特征图,包括:通过预设检测器网络中的检测头预设若干不同anchor,以便基于所述若干不同anchor对输入图像进行特征提取,以得到多尺度特征图;所述特征提取操作包括卷积操作,池化操作;将所述多尺度特征图输入至所述预设检测器网络中的预设特征图处理模块,以便通过预设处理规则对所述多尺度特征图进行处理,以得到包含若干预测边界框的处理后特征图。3.根据权利要求2所述的基于深度IoU网络的目标检测方法,其特征在于,所述通过预设处理规则对所述多尺度特征图进行处理,以得到包含若干预测边界框的处理后特征图,包括:依次利用归一化层、多头注意模块、随机失活层、所述归一化层、前馈神经网络、所述随机失活层对所述多尺度特征图进行处理,以得到包含若干预测边界框的所述处理后特征图。4.根据权利要求2所述的基于深度IoU网络的目标检测方法,其特征在于,所述对所述处理后特征图进行预测,以获得与所述若干预测边界框对应的特征信息,包括:利用所述检测头为所述预测边界框生成回归输出坐标;所述回归输出坐标包括所述预测边界框的中心坐标与所述边界框的高度与宽度;通过所述预设检测器网络中的分类头生成网络输出置信度与表示有无检测目标的标签。5.根据权利要求4所述的基于深度IoU网络的目标检测方法,其特征在于,还包括:获取历史训练数据中的若干真实...

【专利技术属性】
技术研发人员:张妮吴庆耀谭明奎胡灏李利岑俊华张木树杨正文
申请(专利权)人:广东广物互联网科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1