一种目标检测方法、装置、设备及介质制造方法及图纸

技术编号:35150222 阅读:13 留言:0更新日期:2022-10-05 10:28
本申请实施例公开了一种目标检测方法、装置、设备及介质,涉及计算机视觉技术领域。该方法包括:通过在检测网络的训练阶段,对训练图像的标注框附近指定区域内的特征向量进行信息熵计算以确定标注框附近的信息熵阈值。该信息熵阈值表征标注框周边的环境特征,由此在检测网络收敛后,通过待处理视频进行识别以确定第一图像目标区域内的特征向量,进而通过对特征向量进行信息熵计算以确定目标区域内的平均信息熵。上述平均信息熵表征了第一检测对象周边的环境特征,根据平均信息熵与信息熵阈值的比对结果即可确定第一检测对象周边的环境特征是否与标注框周边的环境特征相像,进而确定第一检测对象是否为待搜索目标。定第一检测对象是否为待搜索目标。定第一检测对象是否为待搜索目标。

【技术实现步骤摘要】
一种目标检测方法、装置、设备及介质


[0001]本申请实施例涉及计算机视觉
,具体涉及一种目标检测方法、装置、设备及介质。

技术介绍

[0002]城市的市貌治理是现代化智慧城市建设的重要指标,其中广告牌的违规安置是市貌治理的一大难题。目前多通过管控人员对城市摄像头点位捕捉的视频图像进行巡检,以人工的方式监测点位附近是否存在违规安置的广告牌。上述方式需求较高的人力成本,且处理效率较低。
[0003]随着科技的发展,针对违规广告牌的检测任务在业内已有所开发。相关技术中多通过训练检测模型以使模型收敛后具备自动判别输入图像中是否存在违规安置的广告牌的能力。然而当前针对违规广告牌的检测模型多存在下述问题,由于广告牌所在街道环境较为复杂,普通算法模型在复杂街道场景下的鲁棒性较差,无法对广告牌是否违规做出准确判断。而精度较高的算法模型通常过于庞大和复杂,不宜在嵌入式设备内部署,存在适用性较低的问题。

技术实现思路

[0004]本申请实施例提供一种目标检测方法、装置、设备及介质,用于通过检测模型确定图像中广告牌所在位置之后,根据图像中广告牌附近特征向量的平均信息熵确定广告牌是否违规安置。
[0005]第一方面,本申请实施例提供一种目标检测方法,所述方法包括:
[0006]将待检测视频输入已训练的检测网络中,通过所述检测网络对所述待检测视频中每一视频图像进行识别,得到包含第一预测框的第一图像;所述第一图像为所述待检测视频中包含所述第一检测对象的视频图像,所述第一预测框表征所述第一检测对象在所述第一图像中的位置区域;
[0007]针对每一第一图像,根据所述第一图像中目标区域的特征向量确定所述特征向量的平均信息熵;其中,所述特征向量是通过所述检测网络对所述第一图像进行特征提取得到的;所述目标区域是根据所述第一预测框确定的;
[0008]基于所述平均信息熵与信息熵阈值的比对结果确定所述第一图像中的第一检测对象是否为待搜索目标;其中,所述信息熵阈值是根据所述检测网络在训练过程中对训练图像指定区域内的特征向量进行信息熵计算得到的,所述指定区域是根据所述训练图像内的标注框确定的;所述待搜索目标为指定类别的第一检测对象。
[0009]本申请实施例通过在检测网络的训练阶段,对训练图像的标注框附近指定区域内的特征向量进行信息熵计算以确定标注框附近的信息熵阈值。该信息熵阈值表征标注框周边的环境特征,由此在检测网络收敛后,通过待处理视频进行识别以确定第一图像目标区域内的特征向量,进而通过对特征向量进行信息熵计算以确定目标区域内的平均信息熵。
上述平均信息熵表征了第一检测对象周边的环境特征,根据平均信息熵与信息熵阈值的比对结果即可确定第一检测对象周边的环境特征是否与标注框周边的环境特征相像,进而确定第一检测对象是否为待搜索目标。
[0010]在一些可能的实施例中,所述第一预测框四周设有指定数量的目标区域,各所述目标区域的尺寸是基于所述第一预测框的尺寸确定的;
[0011]所述根据所述第一图像中目标区域的特征向量确定平均信息熵,包括:
[0012]分别获取每一目标区域的特征向量;
[0013]针对每一目标区域,根据所述目标区域内的特征向量确定所述目标区域的平均信息熵。
[0014]在一些可能的实施例中,所述基于所述平均信息熵与信息熵阈值的比对结果确定所述第一图像中的第一检测对象是否为待搜索目标,包括:
[0015]若存在指定数量的目标区域的平均信息熵大于所述目标区域对应的信息熵阈值,则确定所述第一检测对象不为所述待搜索目标。
[0016]在一些可能的实施例中,所述检测网络还用于识别输入图像中是否包含第二检测对象,以及确定表征所述第二检测对象在所述输入图像中所在位置的第二预测框;所述输入图像包括所述视频图像;
[0017]所述基于所述平均信息熵与信息熵阈值的比对结果确定所述第一图像中的第一检测对象是否为待搜索目标之后,所述方法还包括:
[0018]确定第二图像中第一预测框与第二预测框间的交并比;其中,所述第二图像为基于所述比对结果确定第一检测对象为所述待搜索目标的第一图像;
[0019]基于所述交并比确定所述第二图像中的第一检测对象是否为所述待搜索目标,并将第一检测对象为所述待搜索目标的第二图像输出展示。
[0020]在一些可能的实施例中,所述基于所述交并比确定所述第二图像中的第一检测对象是否为所述待搜索目标,包括:
[0021]根据所述第二图像对应的视频图像在所述待检测视频中的时序位置确定比对图像;
[0022]根据所述比对图像中第一预测框与第二预测框间的交并比确定所述第一检测对象是否为所述待搜索目标。
[0023]在一些可能的实施例中,所述根据所述第二图像对应视频图像在所述待检测视频中的时序位置确定比对图像,包括:
[0024]确定时序位于所述视频图像之前,和/或时序位于所述视频图像之后的预设帧图像;
[0025]将所述预设帧图像对应的第一图像作为所述比对图像。
[0026]第二方面,本申请实施例提供了一种目标检测装置,所述装置包括:
[0027]图像识别模块,被配置为执行将待检测视频输入已训练的检测网络中,通过所述检测网络对所述待检测视频中每一视频图像进行识别,得到包含第一预测框的第一图像;所述第一图像为所述待检测视频中包含所述第一检测对象的视频图像,所述第一预测框表征所述第一检测对象在所述第一图像中的位置区域;
[0028]信息熵获取模块,被配置为执行针对每一第一图像,根据所述第一图像中目标区
域的特征向量确定所述特征向量的平均信息熵;其中,所述特征向量是通过所述检测网络对所述第一图像进行特征提取得到的;所述目标区域是根据所述第一预测框确定的;
[0029]目标判别模块,被配置为执行基于所述平均信息熵与信息熵阈值的比对结果确定所述第一图像中的第一检测对象是否为待搜索目标;其中,所述信息熵阈值是根据所述检测网络在训练过程中对训练图像指定区域内的特征向量进行信息熵计算得到的,所述指定区域是根据所述训练图像内的标注框确定的;所述待搜索目标为指定类别的第一检测对象。
[0030]在一些可能的实施例中,所述第一预测框四周设有指定数量的目标区域,各所述目标区域的尺寸是基于所述第一预测框的尺寸确定的;
[0031]执行所述根据所述第一图像中目标区域的特征向量确定平均信息熵,所述信息熵获取模块被配置为:
[0032]分别获取每一目标区域的特征向量;
[0033]针对每一目标区域,根据所述目标区域内的特征向量确定所述目标区域的平均信息熵。
[0034]在一些可能的实施例中,执行所述基于所述平均信息熵与信息熵阈值的比对结果确定所述第一图像中的第一检测对象是否为待搜索目标,所述目标判别模块被配置为:
[0035]若存在指定数量的目标区域的平均信息熵大于所述目标区域对应的信息熵阈值,则确定所述第一检测对象不为所述待搜索目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,所述方法包括:将待检测视频输入已训练的检测网络中,通过所述检测网络对所述待检测视频中每一视频图像进行识别,得到包含第一预测框的第一图像;所述第一图像为所述待检测视频中包含所述第一检测对象的视频图像,所述第一预测框表征所述第一检测对象在所述第一图像中的位置区域;针对每一第一图像,根据所述第一图像中目标区域的特征向量确定所述特征向量的平均信息熵;其中,所述特征向量是通过所述检测网络对所述第一图像进行特征提取得到的;所述目标区域是根据所述第一预测框确定的;基于所述平均信息熵与信息熵阈值的比对结果确定所述第一图像中的第一检测对象是否为待搜索目标;其中,所述信息熵阈值是根据所述检测网络在训练过程中对训练图像指定区域内的特征向量进行信息熵计算得到的,所述指定区域是根据所述训练图像内的标注框确定的;所述待搜索目标为指定类别的第一检测对象。2.根据权利要求1所述的方法,其特征在于,所述第一预测框四周设有指定数量的目标区域,各所述目标区域的尺寸是基于所述第一预测框的尺寸确定的;所述根据所述第一图像中目标区域的特征向量确定平均信息熵,包括:分别获取每一目标区域的特征向量;针对每一目标区域,根据所述目标区域内的特征向量确定所述目标区域的平均信息熵。3.根据权利要求2所述的方法,其特征在于,所述基于所述平均信息熵与信息熵阈值的比对结果确定所述第一图像中的第一检测对象是否为待搜索目标,包括:若存在指定数量的目标区域的平均信息熵大于所述目标区域对应的信息熵阈值,则确定所述第一检测对象不为所述待搜索目标。4.根据权利要求1所述的方法,其特征在于,所述检测网络还用于识别输入图像中是否包含第二检测对象,以及确定表征所述第二检测对象在所述输入图像中所在位置的第二预测框;所述输入图像包括所述视频图像;所述基于所述平均信息熵与信息熵阈值的比对结果确定所述第一图像中的第一检测对象是否为待搜索目标之后,所述方法还包括:确定第二图像中第一预测框与第二预测框间的交并比;其中,所述第二图像为基于所述比对结果确定第一检测对象为所述待搜索目标的第一图像;基于所述交并比确定所述第二图像中的第一检测对象是否为所述待搜索目标,并将第一检测对象为所述待搜索目标的第二图像输出展示。5.根据权利要求4所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:余正法周祥明章合群傅凯白家男
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1