视频图像的目标检测方法、电子设备以及可读存储介质技术

技术编号:33912715 阅读:18 留言:0更新日期:2022-06-25 19:44
本发明专利技术实施例提供了一种视频图像的目标检测方法、电子设备以及可读存储介质,涉及图像处理技术领域。视频图像的目标检测方法包括:分别对视频图像的每帧图像进行目标检测,得到各帧图像的目标检测结果,目标检测结果包括:检测对象对应的边界框与各检测对象的分类得分向量;对于相邻的两帧图像,若后一帧图像中存在与前一帧图像中的检测对象匹配的检测对象,将相邻的两帧图像之间匹配的两个检测对象加入同一个对象序列;对于每个目标对象,基于目标对象所属的对象序列中包含的多个检测对象的分类得分向量与目标对象的分类得分向量,对目标对象的分类得分向量进行修正。本发明专利技术中,提升了视频图像目标检测的准确度。提升了视频图像目标检测的准确度。提升了视频图像目标检测的准确度。

【技术实现步骤摘要】
视频图像的目标检测方法、电子设备以及可读存储介质


[0001]本专利技术涉及图像处理
,具体涉及一种视频图像的目标检测方法、电子设备以及可读存储介质。

技术介绍

[0002]目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标物体,并确定找出的目标物体的类别和位置,是计算机视觉领域的核心问题之一。目前,常用的目标检测算法包括:R

CNN(Regions with CNN features)算法、Fast R

CNN算法、Faster RCNN算法、YOLO算法(You Only Look Once)。
[0003]然而,在对视频图像进行目标检测时,由于运动模糊、罕见角度,失焦,遮挡等问题,会对视频中连续多帧图像的目标检测精度造成影响。

技术实现思路

[0004]本专利技术的目的是提供了一种视频图像的目标检测方法、电子设备以及可读存储介质,能够使得修正得到的分类得分向量更加准确,提升了视频图像的各帧图像的目标检测结果的精确度,即提升了视频图像目标检测的准确度。
[0005]为实现上述目的,本专利技术提供了一种视频图像的目标检测方法,包括:
[0006]分别对视频图像的每帧图像进行目标检测,得到各帧图像的目标检测结果,所述目标检测结果包括:检测对象对应的边界框与各所述检测对象的分类得分向量;对于相邻的两帧图像,若后一帧图像中存在与前一帧图像中的所述检测对象匹配的所述检测对象,将所述相邻的两帧图像之间匹配的两个所述检测对象加入同一个对象序列,其中匹配的两个所述检测对象的边界框相匹配;对于每个所述目标对象,基于所述目标对象所属的所述对象序列中包含的多个所述检测对象的分类得分向量与所述目标对象的分类得分向量,对所述目标对象的分类得分向量进行修正,所述目标对象为位于所述对象序列中的所述检测对象。
[0007]本专利技术还提供了一种电子设备,包括:至少一个处理芯片;以及,与所述至少一个处理芯片通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理芯片执行的指令,所述指令被所述至少一个处理芯片执行,以使所述至少一个处理芯片能够执行如上述的视频图像的目标检测方法。
[0008]本专利技术还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序运行时实现如视频图像的目标检测方法。
[0009]本专利技术实施例提供了一种视频图像的目标检测方法,在对对象序列中的目标对象的分类得分向量进行修正时,结合目标对象所属的对象序列中所有的检测对象的分类得分向量以及该目标对象自身的分类得分向量,由此能够使得修正得到的目标对象的分类得分向量更加准确,提升了视频图像的各帧图像的目标检测结果的精确度,即提升了视频图像目标检测的准确度。
[0010]在一个实施例中,所述对于每个所述目标对象,基于所述目标对象所属的所述对象序列中包含的多个所述检测对象的分类得分向量与所述目标对象的分类得分向量,对所述目标对象的分类得分向量进行修正,所述目标对象为位于所述对象序列中的所述检测对象,包括:对于每个所述目标对象,基于所述目标对象所属的所述对象序列所包含的多个所述检测对象各类别的分类得分的均值与所述目标对象各类别的分类得分,分别对所述目标对象的各类别的分类得分进行修正。
[0011]在一个实施例中,修正后的所述目标对象的当前类别的分类得分的计算公式为:Score
new
=α*Score
mean
+β*Score
old
;其中,Score
new
为修正后的所述目标对象的当前类别的分类得分,Score
mean
为所述目标对象所属的所述对象序列中包含的多个所述检测对象的当前类别的分类得分的平均值,Score
old
为修正前的所述目标对象的当前类别的分类得分,α、β均为小于1的正数。
[0012]在一个实施例中,α为0.9,β为0.1。
[0013]在一个实施例中,对于相邻的两帧图像,若后一帧图像中存在与前一帧图像中的所述检测对象匹配的所述检测对象,将所述相邻的两帧图像之间匹配的两个所述检测对象加入同一个对象序列,包括:对于相邻的两帧图像,基于后一帧图像包含的各所述检测对象的边界框、前一帧图像包含的各所述检测对象的边界框以及所述相邻的两帧图像上各所述检测对象的分类置信度,得到所述相邻的两帧图像上的两个所述检测对象之间的链接分数;选取所述相邻的两帧图像上链接分数大于预设的分数阈值的两个所述检测对象作为匹配的两个所述检测对象,并将所述相邻的两帧图像之间匹配的两个所述检测对象加入同一个对象序列。
[0014]在一个实施例中,所述对于相邻的两帧图像,基于后一帧图像包含的各所述检测对象的边界框、前一帧图像包含的各所述检测对象的边界框以及所述相邻的两帧图像上各所述检测对象的分类置信度,得到所述相邻的两帧图像上的两个所述检测对象之间的链接分数,包括:获取第一检测对象对应的第一边界框与第二检测对象对应的第二边界框之间的交并比、所述第一边界框的中心点与所述第二边界框的中心点之间的距离,以及所述第一边界框与所述第二边宽之间的长度比值与宽度比值;所述第一检测对象为前一帧图像中的所述检测对象、所述第二检测对象为后一帧图像中的所述检测对象;基于所述第一检测对象与所述第二检测对象之间的所述交并比、所述距离、所述长度比值、所述宽度比值以及所述第一检测对象与所述第二检测对象的分类置信度,得到所述第一检测对象与所述第二检测对象之间的链接分数。
[0015]在一个实施例中,在所述对于每个所述目标对象,基于所述目标对象所属的所述对象序列中包含的多个所述检测对象的分类得分与所述目标对象的分类得分,对所述目标对象的分类得分进行修正,所述目标对象为位于所述对象序列中的所述检测对象之后,还包括:基于各帧图像中修正后每个所述检测对象的分类得分向量,选取分类得分向量中分类得分最大的类别作为各帧图像中每个检测对象的类别。
附图说明
[0016]图1是根据本专利技术第一实施例中的视频图像的目标检测方法的具体流程图;
[0017]图2是根据本专利技术第一实施例中的视频图像中相邻的三帧图像的示意图;
[0018]图3是根据本专利技术第二实施例中的视频图像的目标检测方法的具体流程图;
[0019]图4是根据本专利技术第三实施例中的视频图像的目标检测方法的具体流程图;
[0020]图5是根据本专利技术第三实施例中的相邻两帧图像中边界框之间的链接分数的示意图;
[0021]图6是图4中的视频图像的目标检测方法的子步骤3021的具体流程图。
具体实施方式
[0022]以下将结合附图对本专利技术的各实施例进行详细说明,以便更清楚理解本专利技术的目的、特点和优点。应理解的是,附图所示的实施例并不是对本专利技术范围的限制,而只是为了说明本专利技术技术方案的实质精神。
[0023]在下文的描述中,出于说明各种公开的实施例的目的阐述了某些具体细节以提供对各种公开实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频图像的目标检测方法,其特征在于,包括:分别对视频图像的每帧图像进行目标检测,得到各帧图像的目标检测结果,所述目标检测结果包括:检测对象对应的边界框与各所述检测对象的分类得分向量;对于相邻的两帧图像,若后一帧图像中存在与前一帧图像中的所述检测对象匹配的所述检测对象,将所述相邻的两帧图像之间匹配的两个所述检测对象加入同一个对象序列,其中匹配的两个所述检测对象的边界框相匹配;对于每个所述目标对象,基于所述目标对象所属的所述对象序列中包含的多个所述检测对象的分类得分向量与所述目标对象的分类得分向量,对所述目标对象的分类得分向量进行修正,所述目标对象为位于所述对象序列中的所述检测对象。2.根据权利要求1所述的视频图像的目标检测方法,其特征在于,所述对于每个所述目标对象,基于所述目标对象所属的所述对象序列中包含的多个所述检测对象的分类得分向量与所述目标对象的分类得分向量,对所述目标对象的分类得分向量进行修正,所述目标对象为位于所述对象序列中的所述检测对象,包括:对于每个所述目标对象,基于所述目标对象所属的所述对象序列所包含的多个所述检测对象各类别的分类得分的均值与所述目标对象各类别的分类得分,分别对所述目标对象的各类别的分类得分进行修正。3.根据权利要求2所述的视频图像的目标检测方法,其特征在于,修正后的所述目标对象的当前类别的分类得分的计算公式为:Score
new
=α*Score
mean
+β*Score
old
;其中,Score
new
为修正后的所述目标对象的当前类别的分类得分,Score
mean
为所述目标对象所属的所述对象序列中包含的多个所述检测对象的当前类别的分类得分的平均值,Score
old
为修正前的所述目标对象的当前类别的分类得分,α、β均为小于1的正数。4.根据权利要求3所述的视频图像的目标检测方法,其特征在于,α为0.9,β为0.1。5.根据权利要求1所述的视频图像的目标检测方法,其特征在于,所述对于相邻的两帧图像,若后一帧图像中存在与前一帧图像中的所述检测对象匹配的所述检测对象,将所述相邻的两帧图像之间匹配的两个所述检测对象加入同一个对象序列,包括:对于相邻...

【专利技术属性】
技术研发人员:朱海迪李宝清袁晓兵
申请(专利权)人:上海事凡物联网科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1