一种模拟视觉皮质机制的视频目标跟踪方法技术

技术编号:14952901 阅读:109 留言:0更新日期:2017-04-02 09:53
本发明专利技术公开了一种模拟视觉皮质机制的视频目标跟踪方法,包括离线训练和在线跟踪;所述离线训练:构建跟踪目标图像样本集;对样本建立图像金字塔,提取BIM特征,进行分类器训练;所述在线跟踪:对待检测图像初始化检测区域,建立检测区域的图像金字塔;对图像金字塔提取BIM特征,在提取BIM特征的过程中得到多个匹配子块,利用匹配子块预测目标候选区域;依据分类器判定结果从候选区域中迭代选出潜在目标区域;从潜在目标区域中选取目标区域概率最大者即为最终的目标区域。本发明专利技术利用BIM建立目标的外观模型并引入跟踪框架,能够模拟视觉皮质工作机制稳健地跟踪目标。

【技术实现步骤摘要】

本专利技术属于计算机视觉和神经生物学领域,具体涉及一种模拟视觉皮质机制的视频目标跟踪方法
技术介绍
生物激励模型(Biologicallyinspiredmodel,BIM)是由Serre等人依据神经生理学家Hubel和Wiesel对视觉皮质研究成果的基础上建立。BIM的特征提取是一个4分层结构模型,4层结构分别命名为S1、C1、S2和C2。S1和C1层对应视觉皮质的V1层,提取能容忍平移变换的目标纹理特征;S2和C2层对应视觉皮质的MST区,提取能够区分目标的类特征。由于BIM以神经生理学研究成果作为基础,相比其他人工提取的特征具有不可比拟的优越性,此模型被广泛应用于计算机视觉任务,例如行为识别、年龄识别、场景识别等。随着高性能GPU和分布式系统的开发,将BIM用于视频目标跟踪任务成为可能。视频目标跟踪的研究主要步骤为:目标检测,目标外观模型的建立以及对目标的快速搜索。第一步需要从背景图像中对目标进行准确定位,这一环节现在已作为一个独立的研究方向;第二步是提取能够自适应目标外观变化的特征来建立目标的外观模型,所选特征可以包含目标的颜色、形状、纹理等信息;第三步设计高效的搜索策略,快速的定位目标。目前主要有以下搜索算法:粒子滤波、光流法、均值平移算法等。近年来视频目标跟踪算法研究取得了很大的进展,获得不错的跟踪效果。但模拟视觉皮质机制的目标跟踪算法却少有研究,将BIM引入目标跟踪算法能够使计算机实现更加符合人类视觉皮质的工作机制,达到精确度高、鲁棒性好的跟踪效果。
技术实现思路
针对现有技术存在的问题和迫切需求,本专利技术提供了一种视频目标跟踪方法及系统,其目的在于,利用BIM建立目标的外观模型并引入跟踪框架,使得计算机能够模拟视觉皮质工作机制稳健地跟踪目标。一种模拟视觉皮质机制的视频目标跟踪方法,包括离线训练和在线跟踪两个阶段;所述离线训练阶段包括以下步骤:(11)构建跟踪目标图像的正负样本集;(12)对正负样本建立图像金字塔,提取图像金字塔的BIM特征,依据BIM特征进行第一轮的分类器训练,按照分类器训练得到的权重大小筛选特征以降低特征维数;(13)利用降低特征维数后的BIM特征进行第二轮的分类器训练;所述在线跟踪阶段包括以下步骤:(21)对待检测图像初始化检测区域,建立检测区域的图像金字塔;(22)对检测区域的图像金字塔提取BIM特征,将其送入步骤(13)训练好的分类器,分类器输出检测区域的判定结果;在提取BIM特征的过程中得到多个匹配子块,利用匹配子块预测目标候选区域;(23)依据分类器判定结果从候选区域中迭代选出潜在目标区域;(24)从潜在目标区域中选取目标区域概率最大者即为最终的目标区域。进一步地,所述步骤(12)的具体实现方式为:(121)对每一个样本建立图像金字塔并提取BIM特征,包括S1层特征、S2层特征、S3层特征和S4层特征;所述S1层特征的计算方式为:将图像金字塔通过S1层计算单元计算的结果定义为S1层特征;S1层计算单元是4个Gabor滤波器构成的滤波器组,表示为:x0=xcosθ+ysinθ,y0=-xsinθ+ycosθ式中,F(x,y,θ)表示滤波器在坐标(x,y)处所对应的响应值,θ控制滤波器的方向,取值分别为4个方向对应4个Gabor滤波器;γ表示滤波器的长宽比,σ表示滤波器的带宽,λ表示滤波器的波长;所述C1层特征的计算方式为:将S1层特征通过C1计算单元的计算结果定义为C1层特征;C1层计算单元对输入的S1层特征对应的局部邻域内提取最大值,计算单元设定的局部邻域为从S1层特征对应的图像金字塔中提取的一个局部金字塔;所述S2层特征的计算方式为:将C1层特征通过S2层计算单元的计算结果定义为S2层特征,S2层计算单元计算C1层金字塔中的特征子块X与每个子块模板之间的相似性度,所述是从多个样本的C1层特征上随机抽取的子块,d为抽取子块的数量;所述相似度函数定义为:式中,所述C2层特征的计算方式为:将S2层特征通过C2层计算单元的计算结果定义为C2层特征,C2层计算单元计算C1层金字塔中每一个特征子块的相似度响应全局最大值;(122)筛选特征子块将C2层特征送入分类器训练,利用分类器的特征选择能力,对d个子块模板根据分类器训练得到的对应权重大小进行排序,选择最大的k个子块模板用于第二轮的分类器训练,k<d。进一步地,所述步骤(22)的具体实现方式为:(221)对检测区域的图像金字塔提取BIM特征,将其送入步骤(13)训练好的分类器,分类器输出检测区域的判定结果;(222)对检测区域的图像金字塔提取BIM特征,得到k个子块模板对应的最佳匹配子块,利用匹配子块预测目标的候选区域,具体的实现方式为:令检测区域的图像金字塔底层的几何中心为(x,y)坐标原点,匹配子块的中心相对坐标原点的向量定义为匹配子块相对于坐标原点的坐标位置(dx,dy),令两子块模板之间的距离为Dij,i,j=1,…,k,其对应匹配子块之间的距离为D′ij;计算当前帧的目标尺度因子median()对所有的比值取中位数,提高尺度计算的鲁棒性;根据每个匹配子块预测目标的中心位置构建以目标的中心位置为中心的目标候选区域,由这些目标候选区域构成的集合称为候选集合。进一步地,所述步骤(23)的具体实现方式为:(231)从候选集合中随机选择一个目标候选区域。(232)若分类器输出判定为目标,则从所有候选区域中选取离当前目标候选区域最近的候选区域作为潜在目标区域,并从候选集合中剔除潜在目标区域以及远离检测区域的候选样本;否则,计算远离当前检测区域的候选区域的中心位置均值,选择距离此均值最近的候选区域作为潜在目标区域,并从候选集合中剔除潜在目标区域以及靠近当前检测区域的候选区域;(233)对步骤(232)选定的潜在目标区域提取BIM特征,将其送入步骤(13)训练好的分类器,分类器输出潜在目标区域的判定结果;在提取BIM特征的过程中,S2层和C2层的计算可能会找到新的匹配子块,对新的匹配子块执行与步骤(222)类似的操作,得到新的目标候选区域,将新的目标候选区域加入到候选集合;(234)判定候选集合是否为空,若是,则进入步骤(24),否则返回步骤(231)。进一步地,所述步骤(24)从潜在目标区域中选取对应分类器判定结果表明最有可能为目标区域者即为最终的目标区域。本专利技术通过上述步骤将BIM用于视频目标跟踪,相较于现有的技术,具有如下的优点:相较于其他目标特征提取方法,BIM提取的特征完全模拟视觉皮质工作,更符合生物捕获目标的一般特性,具有鲁棒性好的特点;C1层中的子块是一种局部特征,具有定位局部遮挡目标的功能,而C2层特征是一种全局特征,虽然没有定位功能但是经过机器学习却有很强的区分目标和背景的能力。本专利技术将这两种特征结合起来,能够发挥各自的优势,既能提高跟踪的速度,也能确保跟踪的精度。附图说明图1为本专利技术视频目标跟踪方法实现流程图;图2为本专利技术BIM特征提取流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间本文档来自技高网...
一种模拟视觉皮质机制的视频目标跟踪方法

【技术保护点】
一种模拟视觉皮质机制的视频目标跟踪方法,其特征在于,包括离线训练和在线跟踪两个阶段;所述离线训练阶段包括以下步骤:(11)构建跟踪目标图像的正负样本集;(12)对正负样本建立图像金字塔,提取图像金字塔的BIM特征,依据BIM特征进行第一轮的分类器训练,按照分类器训练得到的权重大小筛选特征以降低特征维数;(13)利用降低特征维数后的BIM特征进行第二轮的分类器训练;所述在线跟踪阶段包括以下步骤:(21)对待检测图像初始化检测区域,建立检测区域的图像金字塔;(22)对检测区域的图像金字塔提取BIM特征,将其送入步骤(13)训练好的分类器,分类器输出检测区域的判定结果;在提取BIM特征的过程中得到多个匹配子块,利用匹配子块预测目标候选区域;(23)依据分类器判定结果从候选区域中迭代选出潜在目标区域;(24)从潜在目标区域中选取目标区域概率最大者即为最终的目标区域。

【技术特征摘要】
1.一种模拟视觉皮质机制的视频目标跟踪方法,其特征在于,包括离线训练和在线跟踪两个阶段;所述离线训练阶段包括以下步骤:(11)构建跟踪目标图像的正负样本集;(12)对正负样本建立图像金字塔,提取图像金字塔的BIM特征,依据BIM特征进行第一轮的分类器训练,按照分类器训练得到的权重大小筛选特征以降低特征维数;(13)利用降低特征维数后的BIM特征进行第二轮的分类器训练;所述在线跟踪阶段包括以下步骤:(21)对待检测图像初始化检测区域,建立检测区域的图像金字塔;(22)对检测区域的图像金字塔提取BIM特征,将其送入步骤(13)训练好的分类器,分类器输出检测区域的判定结果;在提取BIM特征的过程中得到多个匹配子块,利用匹配子块预测目标候选区域;(23)依据分类器判定结果从候选区域中迭代选出潜在目标区域;(24)从潜在目标区域中选取目标区域概率最大者即为最终的目标区域。2.根据权利要求1所述的模拟视觉皮质机制的视频目标跟踪方法,其特征在于,所述步骤(12)的具体实现方式为:(121)对每一个样本建立图像金字塔并提取BIM特征,包括S1层特征、S2层特征、S3层特征和S4层特征;所述S1层特征的计算方式为:将图像金字塔通过S1层计算单元计算的结果定义为S1层特征;S1层计算单元是4个Gabor滤波器构成的滤波器组,表示为:F(x,y,θ)=exp(-x02+γ2y022σ2)sin(2πλx0);x0=xcosθ+ysinθ,]]>y0=-xsinθ+ycosθ式中,F(x,y,θ)表示滤波器在坐标(x,y)处所对应的响应值,θ控制滤波器的方向,取值分别为4个方向对应4个Gabor滤波器;γ表示滤波器的长宽比,σ表示滤波器的带宽,λ表示滤波器的波长;所述C1层特征的计算方式为:将S1层特征通过C1计算单元的计算结果定义为C1层特征;C1层计算单元对输入的S1层特征对应的局部邻域内提取最大值,计算单元设定的局部邻域为从S1层特征对应的图像金字塔中提取的一个局部金字塔;所述S2层特征的计算方式为:将C1层特征通过S2层计算单元的计算结果定义为S2层特征,S2层计算单元计算C1层金字塔中的特征子块X与每个子块模板之间的相似性度,所述是从多个样本的C1层特征上随机抽取的子块,d为抽取子块的数量;所述相似度函数定义为:式中,所述C2层特征的计算方式为:将S2层特征通过C2层计算单元的计...

【专利技术属性】
技术研发人员:陈靓影徐如意张坤刘乐元
申请(专利权)人:华中师范大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1