【技术实现步骤摘要】
基于稀疏前景先验的视频目标检测方法、存储介质及设备
[0001]本专利技术属于计算机视觉
,具体涉及一种基于稀疏前景先验的视频目标检测方法、存储介质及设备。
技术介绍
[0002]计算机视觉是人工智能的一个重要领域,它通过训练计算机来学习和理解现实视觉。借助图片和视频以及深度学习模型,可以做到准确地分类和识别所关注的目标,进而做出进一步的判断处理。计算机视觉一般分为图像识别、目标检测、实例分割等主要任务。其中,分类任务一般给出的是整张图片的内容描述,而检测任务则更关注特定的感兴趣物体目标,要求同时获得感兴趣目标的识别结果和定位结果。相比于分类任务,检测是对图片前景和背景的理解,同时还需要从背景中分离出感兴趣的目标,并确定感兴趣目标的识别和位置信息。
[0003]目标检测是计算机视觉研究领域的一个热门方向,广泛应用于机器人导航、视频监控、工业检测、人脸识别等诸多领域。图像目标检测任务在过去几年的时间取得了巨大的进展,检测性能得到明显提升。然而在视频监控、车辆辅助驾驶等领域,基于视频的目标检测有着更为广泛的需求。但是,要将图像检测技术直接用到视频检测任务会面临新的挑战。第一,把图像目标检测网络直接应用到视频中的每一帧进行检测会带来巨大的计算成本;第二,传统图像目标检测方法不能有效利用视频数据时序连续性和稀疏前景的先验,较难挖掘视频数据中的时序特性。
[0004]视频是由图像组成的,视频目标检测与图像目标检测存在着紧密的联系。为了提高视频检测准确率,通常在图像目标检测对每一帧进行检测之后,利用视频特有 ...
【技术保护点】
【技术特征摘要】
1.基于稀疏前景先验的视频目标检测方法,其特征在于,包括以下步骤:S1、将视频V分成m个视频片段C
i
,i=1,2,
…
,m,对每个视频片段C
i
采用基于正交子空间学习的前景提取算法得到视频片段内第t帧视频帧I
(t)
的稀疏前景图E
(t)
;S2、分别将视频帧I
(t)
与稀疏前景图E
(t)
输入ResNet特征提取网络,ResNet特征提取网络的每一层分别输出对应层的特征图F
(t)
和稀疏前景先验特征图计算视频帧I
(t)
的特征图F
(t)
及其稀疏前景图E
(t)
的稀疏前景先验特征图S3、通过特征金字塔结构,将视频帧I
(t)
的每一层特征F
(t)
和对应稀疏前景先验特征分别与更高层上采样得到的特征组合,计算视频帧I
(t)
的语义增强特征和前景语义增强特征S4、将视频帧I
(t)
的语义增强特征和对应前景语义增强特征进行融合,得到视频帧I
(t)
的前景先验融合特征图S5、在视频帧I
(t)
的前景先验融合特征图中生成锚框;S6、将视频帧I
(t)
的前景先验融合特征图及所有锚框输入到训练好的分类和回归网络,分别得到视频帧I
(t)
中所有目标的分类和定位结果,完成目标检测。2.根据权利要求1所述的基于稀疏前景先验的视频目标检测方法,其特征在于,步骤S1中,将视频片段C
i
内的每一帧图像I
(t)
灰度化后转化为列向量,将这些列向量组合成二维矩阵X,根据目标函数计算得到视频片段C
i
中所有帧的稀疏前景先验E,再将E按列拆分,还原得到每一帧I
(t)
的对应稀疏前景图E
(t)
,目标函数计算如下:其中,D为正交子空间,θ为正交子空间系数,α、β为调节参数,||
·
||
row,1
表示矩阵行的1范数,I
k
为阶数为k的单位矩阵。3.根据权利要求2所述的基于稀疏前景先验的视频目标检测方法,其特征在于,采用交替方向法求解目标函数,使用块坐标下降法求解D和θ,定义残差项并利用残差项求解更新D和θ;利用求解得到的D和θ更新收缩函数
·
为逐元素相乘,sign()为符号函数,迭代更新直至达到收敛条件,达到最大迭代次数后,得到视频片段C
i
中所有帧的稀疏前景...
【专利技术属性】
技术研发人员:古晶,巨小杰,马文萍,孙新凯,刘芳,杨淑媛,焦李成,冯婕,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。