一种目标检测方法及装置制造方法及图纸

技术编号:39002739 阅读:11 留言:0更新日期:2023-10-07 10:34
本申请公开了一种目标检测方法及装置,对待检测视频中的视频帧进行分组,获得至少一个视频帧组,对每个视频帧组进行抽帧操作,获取每个视频帧组中的参考视频帧。对每个参考视频帧进行目标检测,获取每个参考视频帧的目标检测结果。基于待检测视频中各个参考视频帧的目标检测结果,在待检测视频的除参考视频帧之外的每个剩余视频帧中进行目标追踪,可获取每个剩余视频帧的目标检测结果。基于各个参考视频帧的目标检测结果和各个剩余视频帧的目标检测结果,确定待检测视频的每个视频帧的目标检测结果。如此,在剩余视频帧中进行目标追踪时,以参考视频帧的目标检测结果为参考,可以缩小剩余视频帧中目标的搜索范围,提高目标的检测速度。速度。速度。

【技术实现步骤摘要】
一种目标检测方法及装置


[0001]本申请涉及信息处理
,尤其涉及一种目标检测方法及装置。

技术介绍

[0002]在视频中通常会存在一些用户关注的目标图像,检测每个视频帧中的该目标图像,以便对视频中的该目标图像进行相应处理。
[0003]目前,逐个对视频中的每个视频帧进行目标检测,才能获取每个视频帧的目标检测结果。但是,这种方法的检测效率较低,不能满足视频处理的时效性需求。

技术实现思路

[0004]为了解决上述技术问题,本申请提供了一种目标检测方法及装置,能够提高整个视频的目标检测效率。
[0005]为了实现上述目的,本申请提供的技术方案如下:
[0006]本申请提供一种目标检测方法,所述方法包括:
[0007]对待检测视频中的视频帧进行分组,获得至少一个视频帧组,对每个所述视频帧组进行抽帧操作,获取所述每个视频帧组中的参考视频帧;
[0008]对每个所述参考视频帧进行目标检测,获取每个所述参考视频帧的目标检测结果;
[0009]基于各个所述参考视频帧的目标检测结果,在所述待检测视频的除所述参考视频帧之外的每个剩余视频帧中进行目标追踪,获取每个所述剩余视频帧的目标检测结果;
[0010]基于各个所述参考视频帧的目标检测结果和各个所述剩余视频帧的目标检测结果,获取所述待检测视频中每个视频帧的目标检测结果。
[0011]可选地,所述视频帧组中的视频帧在时间上是连续的,前一个所述视频帧组的最后一个视频帧和相邻下一个所述视频帧组的第一个视频帧在时间上是连续的;
[0012]所述基于各个所述参考视频帧的目标检测结果,在所述待检测视频的除所述参考视频帧之外的每个剩余视频帧中进行目标追踪,获取每个所述剩余视频帧的目标检测结果,包括:
[0013]基于所述参考视频帧的目标检测结果,对所述参考视频帧的相邻前后预设数量的视频帧进行目标追踪,获取所述参考视频帧的相邻前后预设数量的视频帧的待处理目标检测结果;
[0014]对所述待检测视频中的每个剩余视频帧的所述待处理目标检测结果进行去重处理,将每个所述剩余视频帧的满足预设条件的待处理目标检测结果确定为去重处理之后的每个剩余视频帧的目标检测结果。
[0015]可选地,所述对待检测视频中的视频帧进行分组,获得至少一个视频帧组,包括:
[0016]对待检测视频进行场景识别,确定所述待检测视频中的至少一个场景;不同场景中目标的展示形式不同;
[0017]将所述待检测视频中属于同一个场景的视频帧组成一个视频帧组,获得至少一个视频帧组;
[0018]所述基于各个所述参考视频帧的目标检测结果,在所述待检测视频的除所述参考视频帧之外的每个剩余视频帧中进行目标追踪,获取每个所述剩余视频帧的目标检测结果,包括:
[0019]基于所述参考视频帧的目标检测结果,在同一个视频帧组的除所述参考视频帧之外的其他视频帧中进行目标追踪,获取所述待检测视频的每个所述剩余视频帧的目标检测结果。
[0020]可选地,所述待处理目标检测结果包括所述目标的检测框的位置信息,由所述目标的检测框的位置信息绘出得到所述目标的待处理检测框;
[0021]所述对所述待检测视频中的每个剩余视频帧的待处理目标检测结果进行去重处理,将每个所述剩余视频帧的满足预设条件的待处理目标检测结果确定为去重处理之后的每个剩余视频帧的目标检测结果,包括:
[0022]获取所述剩余视频帧中的待处理检测框的置信度;
[0023]按照所述置信度从高到低的顺序,对所述待处理检测框进行排序,并将排序后的所述待处理检测框加入候选框集合;
[0024]将所述候选框集合中置信度最高的所述待处理检测框从所述候选框集合中进行删除,并将所述置信度最高的所述待处理检测框添加到目标框集合中;
[0025]计算所述目标框集合中所述置信度最高的待处理检测框与所述候选框集合中剩余待处理检测框之间的相似度;
[0026]将所述候选框集合中所述相似度满足相似度范围的待处理检测框进行删除;
[0027]重复执行所述将所述候选框集合中置信度最高的所述待处理检测框从所述候选框集合中进行删除,并将所述置信度最高的所述待处理检测框添加到目标框集合中以及后续步骤,直至所述候选框集合中不存在所述待处理检测框,将所述目标框集合中的各个所述待处理检测框的位置信息作为所述剩余视频帧的目标检测结果。
[0028]可选地,所述方法还包括:
[0029]对所述待检测视频中每个视频帧的目标检测结果进行平滑处理,重新获取所述待检测视频中每个视频帧的目标检测结果。
[0030]可选地,所述目标检测结果包括目标的检测框的位置信息,由所述目标的检测框的位置信息绘出得到所述目标的检测框;所述对所述待检测视频中每个视频帧的目标检测结果进行平滑处理,重新获取所述待检测视频中每个视频帧的目标检测结果,包括:
[0031]统计所述待检测视频的每个视频帧中所述目标的检测框的宽度、高度和框中心坐标;
[0032]对所述目标的各个检测框的宽度取均值,获得所述目标的检测框的宽度均值,并对所述目标的各个检测框的高度取均值,获得所述目标的检测框的高度均值;
[0033]基于所述目标的各个检测框的框中心坐标进行直线拟合,获取拟合直线,并将每个视频帧中所述目标的检测框的框中心坐标更新为所述拟合直线上距离所述框中心坐标最近的点的坐标;
[0034]以所述目标的检测框的宽度均值、所述目标的检测框的高度均值作为每个视频帧
中所述目标的检测框的宽度和高度,结合更新后的每个视频帧中所述目标的检测框的框中心坐标,重新构建每个视频帧中所述目标的检测框。
[0035]可选地,所述在所述待检测视频的除所述参考视频帧之外的每个剩余视频帧中进行目标追踪,包括:
[0036]采用预设的目标追踪算法,在所述待检测视频的除所述参考视频帧之外的每个剩余视频帧中进行目标追踪;所述预设的目标追踪算法为基于全卷积孪生网络的目标追踪算法。
[0037]本申请还提供一种目标检测装置,所述装置包括:
[0038]抽帧单元,用于对待检测视频中的视频帧进行分组,获得至少一个视频帧组,对每个所述视频帧组进行抽帧操作,获取所述每个视频帧组中的参考视频帧;
[0039]检测单元,用于对每个所述参考视频帧进行目标检测,获取每个所述参考视频帧的目标检测结果;
[0040]追踪单元,用于基于各个所述参考视频帧的目标检测结果,在所述待检测视频的除所述参考视频帧之外的每个剩余视频帧中进行目标追踪,获取每个所述剩余视频帧的目标检测结果;
[0041]获取单元,用于基于各个所述参考视频帧的目标检测结果和各个所述剩余视频帧的目标检测结果,获取所述待检测视频中每个视频帧的目标检测结果。
[0042]本申请还提供一种电子设备,包括:
[0043]一个或多个处理器;
[0044]存储装置,其上存储有一个或多个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,所述方法包括:对待检测视频中的视频帧进行分组,获得至少一个视频帧组,对每个所述视频帧组进行抽帧操作,获取所述每个视频帧组中的参考视频帧;对每个所述参考视频帧进行目标检测,获取每个所述参考视频帧的目标检测结果;基于各个所述参考视频帧的目标检测结果,在所述待检测视频的除所述参考视频帧之外的每个剩余视频帧中进行目标追踪,获取每个所述剩余视频帧的目标检测结果;基于各个所述参考视频帧的目标检测结果和各个所述剩余视频帧的目标检测结果,获取所述待检测视频中每个视频帧的目标检测结果。2.根据权利要求1所述的方法,其特征在于,所述视频帧组中的视频帧在时间上是连续的,前一个所述视频帧组的最后一个视频帧和相邻下一个所述视频帧组的第一个视频帧在时间上是连续的;所述基于各个所述参考视频帧的目标检测结果,在所述待检测视频的除所述参考视频帧之外的每个剩余视频帧中进行目标追踪,获取每个所述剩余视频帧的目标检测结果,包括:基于所述参考视频帧的目标检测结果,对所述参考视频帧的相邻前后预设数量的视频帧进行目标追踪,获取所述参考视频帧的相邻前后预设数量的视频帧的待处理目标检测结果;对所述待检测视频中的每个剩余视频帧的待处理目标检测结果进行去重处理,将每个所述剩余视频帧的满足预设条件的待处理目标检测结果确定为去重处理之后的每个剩余视频帧的目标检测结果。3.根据权利要求1所述的方法,其特征在于,所述对待检测视频中的视频帧进行分组,获得至少一个视频帧组,包括:对待检测视频进行场景识别,确定所述待检测视频中的至少一个场景;不同场景中目标的展示形式不同;将所述待检测视频中属于同一个场景的视频帧组成一个视频帧组,获得至少一个视频帧组;所述基于各个所述参考视频帧的目标检测结果,在所述待检测视频的除所述参考视频帧之外的每个剩余视频帧中进行目标追踪,获取每个所述剩余视频帧的目标检测结果,包括:基于所述参考视频帧的目标检测结果,在同一个视频帧组的除所述参考视频帧之外的其他视频帧中进行目标追踪,获取所述待检测视频的每个所述剩余视频帧的目标检测结果。4.根据权利要求2所述的方法,其特征在于,所述待处理目标检测结果包括所述目标的检测框的位置信息,由所述目标的检测框的位置信息绘出得到所述目标的待处理检测框;所述对所述待检测视频中的每个剩余视频帧的待处理目标检测结果进行去重处理,将每个所述剩余视频帧的满足预设条件的待处理目标检测结果确定为去重处理之后的每个剩余视频帧的目标检测结果,包括:获取所述剩余视频帧中的待处理检测框的置信度;按照所述置信度从高到低的顺序,对所述待处理检测框进行排序,并将排序后的所述
待处理检测框加入候选框集合;将所述候选框集合中置信度最高的所述待处理检测框从所述候选框集合中进行删除,并将所述置信度最高的所述待处理检测框添加到目标框集合中;计算所述目标框集合中所述置信度最高的待处理检测框与所述候选框集合中剩余待处理检测框之间的相似度;将所述候选框集合中所述相似度满足相似度范围的待处理检测框进行删除;...

【专利技术属性】
技术研发人员:尹天舒
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1