一种多帧目标综合的检测框平滑方法技术

技术编号:36433198 阅读:27 留言:0更新日期:2023-01-20 22:46
本发明专利技术公开了一种多帧目标综合的检测框平滑方法,步骤为(1)计算当前帧检测结果权重,(2)分别取前三帧结果和后一帧结果计算相对于当前帧的检测结果权重,将步骤(1)和(2)得到的5个权重进行归一化,获得归一化权重系数,各归一化系数分别乘以对应帧的结果后累加,获得平滑后的当前帧输出,重复步骤(1)~(4)过程直至视频流数据结束;本发明专利技术方法在视频流检测任务中,相比于神经网络目标检测模型直接输出目标的类别、置信度和框的位置,可以生成更平滑的检测结果,抑制输出目标框的抖动和漏检现象,使神经网络目标检测模型在视频检测任务中具有更高的准确性和稳定性,提升了算法在各领域的实用价值。的实用价值。的实用价值。

【技术实现步骤摘要】
一种多帧目标综合的检测框平滑方法


[0001]本专利技术属于图像处理
,尤其涉及神经网络目标检测模型在视频检测任务中的输出目标检测框的平滑方法。

技术介绍

[0002]目标检测指的是在图像或视频中,标识出目标在图像中的位置坐标、其对应的已知类型的类别。当前,在大数据背景下,人工智能技术已经在各领域获得了迅猛的发展,基于神经网络的目标检测技术在交通监控、军事侦察和预警等领域相对于传统图像算法呈现出极大的优势,并取得了较为出色的实际应用效果。
[0003]当前较为常用的基于神经网络的目标检测算法在检测视频流数据时,大都采用基于单帧图像的目标检测算法,输出的目标在各视频帧之间相互独立,仅与输入的当前帧有关。即将当前帧图像送入神经网络目标检测模型,经过一系列的卷积、池化、融合和下采样等操作,获得不同尺度下的特征图,并从特征图中进行分类、位置回归和非极大值抑制等处理,最终输出的目标在图像中的类别和位置信息。
[0004]在实际应用过程中,基于单帧信息的神经网络目标检测模型在对视频流数据进行检测识别任务时,相邻帧图像,只要输入不完全相本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多帧目标综合的检测框平滑方法,其特征在于:包括如下步骤:(1)计算当前帧检测结果权重;(2)分别取前三帧结果和后一帧结果计算相对于当前帧的检测结果权重;(3)将步骤(1)和(2)得到的5个权重进行归一化,获得归一化权重系数;(4)各归一化系数分别乘以对应帧的结果后累加,获得平滑后的当前帧输出;(5)重复步骤(1)~(4)过程对下一帧进行处理,实现对视频图像中每一帧的输出结果进行平滑。2.根据权利要求1所述的一种多帧目标综合的检测框平滑方法,其特征在于,所述的步骤(1)中神经网络目标检测模型的当前第t帧的某一个输出结果表示为(cls
t
,conf
t
,x
t
,y
t
,w
t
,h
t
),其中cls表示所属类别,conf表示分类的置信度,(x,y,w,h)表示该目标外接矩形框box
t
的中心点坐标及宽和高,当前帧权重为w
t
=1
×
conf
t
。3.根据权利要求2所述的一种多帧目标综合的检测框平滑方法,其特征在于,步骤(2)中对于第t

1帧的输出结果(cls
t
‑1,conf
t
‑1,x
t
‑1,y
t
...

【专利技术属性】
技术研发人员:邹尔博谭海雷波徐寅刘松
申请(专利权)人:武汉华中天经通视科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1