基于多尺度码本模型的红外运动目标检测方法技术

技术编号:10022225 阅读:161 留言:0更新日期:2014-05-09 04:17
本发明专利技术公开了一种基于多尺度码本模型的红外运动目标检测方法,该方法先对红外视频图像进行高斯金字塔分层,然后分别对各层图像建立背景码本模型,根据背景码本模型,检测视频图像中的运动目标,最后将各层图像检测结果进行融合,得到最终视频检测结果。实验结果表明,本发明专利技术中所得到的红外运动目标检测结果相对于传统检测算法结果来说,具有检测效果较好、目标信息丰富,误检率低的特点。它不但可以应用在当前图像融合领域中,以提高融合效果,还可以单独应用在安防监控,夜视侦查等民事和军事领域。

【技术实现步骤摘要】
基于多尺度码本模型的红外运动目标检测方法
本专利技术涉及一种目标检测领域的方法,特别是一种基于红外运动目标检测的检测方法。
技术介绍
红外运动目标检测具有红外成像技术抗干扰能力较强、隐蔽性良好和全天候工作等特点,在军事和民用领域都有着广泛的应用。但是通常在实际应用中,红外目标的背景是复杂多变的,这使得红外运动目标检测算法的实现成为红外系统研究过程中的一项至关重要的技术,不仅在理论方面有着极其重要的意义,在实用方面也有相当大的价值。就目前在军事体系中的应用而言,红外运动目标检测系统可以在空中(包括空-地、空-空、空-海)超远距离目标检测、军事空中导弹防御、军事目标跟踪与攻击、港口情况监视、海洋环境监视、卫星姿态监控等项目中得到应用。同时,红外运动目标检测系统还广泛应用于现代民用领域,在遥感、红外大气云图分析、红外医疗图像病理分析、航拍地面红外图像地质分析、城市红外污染分析和高速公路的车流量检测以及海面人员搜救等领域中,红外目标检测技术也充分展示出了它的强大作用。目前,比较成熟的运动目标检测算法可以分为以下三类:(1)帧差法等简单的运动目标检测算法。帧差法一般指的是前后两帧图像相减,得到的结果按一定阈值做分割,得到运动目标图像,其又可扩展为三帧差分、隔帧差分等算法。它的优点是算法原理简单,计算量小,速度快,占用系统内存较小,适合实时处理。(2)基于光流的运动目标检测算法,按照其理论基础的不同,又可分为:基于梯度的方法、基于匹配的方法、基于能量的方法和基于相位的方法。光流表达了人眼中的图像变化,其中包含了目标运动的信息,利用像素点数值大小的时域变化和相关性可以确定各个像素点位置的“相对运动”,从而确定目标的实际运动状况。它的优点是能检测独立运动对象,可用于摄像头运动场景。(3)基于背景差分法的运动目标检测算法,如多帧平均法,IIR滤波法,高斯建模法等都是侧重于背景差分法中背景的建立或背景的更新机制。在这类目标检测算法中,首先根据一定的原理建立背景模型,然后利用输入一帧图像和背景模型比较,不同的则是运动目标,得到运动目标像素,反之则是背景像素,得到检测结果。这类算法根据背景模型建立的复杂程度,其算法复杂程度相应增加,但总体检测效果较好,多帧平均法检测速度快,IIR滤波法自动更新背景模型,高斯建模法检测准确率高。传统的码本模型也是一种建立背景模型方法,是一种基于背景差分法的运动目标检测算法。基于码本模型的运动目标检测算法基本思路是:首先建立初始码本,然后对一段视频进行训练得到初始背景码本,其次利用背景模型检测当前视频图像中的运动目标,最终得到基于码本模型的运动目标检测结果,传统的码本模型同大部分运动目标检测算法相似,只利用了视频图像的像素信息,而忽略了图像的空间尺度信息,其检测结果中目标整体特征不明显,误检点较多。以上的运动目标检测算法应用在简单的背景中,其检测效果较好。但应用在复杂的背景中,各个算法都有其各自的缺点,检测效果较差,误检率高。帧差法检测目标有难以解决的空洞问题,光流法检测轮廓不明显,多帧平均法检测误差大,IIR滤波法检测结果部分有拖影,高斯建模法计算量大、检测速度缓慢,传统的码本模型目标整体特征不明显、误检点较多。
技术实现思路
本专利技术的目的在于提供一种基于红外运动目标检测的检测方法,从而实现红外视频中的运动目标的检测。实现本专利技术的目的的技术解决方案为:一种基于多尺度码本模型的红外运动目标检测方法,步骤如下:(1)利用红外摄像头采集视频,输入到计算机中,得到红外视频;(2)采用高斯金字塔图像分层模型对红外视频图像进行多尺度分析处理,将视频图像分为三层:原始层、中间层和高斯层;(3)如果当前视频图像是视频的前50帧图像,对步骤(2)中的三层视频图像分别建立初始背景码本模型,前50帧视频的检测结果为视频图像本身,如果当前视频图像不是视频的前50帧图像,则转到步骤(4):如果当前视频图像是视频的第1帧图像,则先建立空的主码本M和缓存码本H,然后将第一帧图像像素值放入初始的主码本M中,得到初始码本,随后转到步骤(6);如果当前视频图像是视频的第2-49帧图像中的一帧,对三层视频图像分别进行初始码本训练,得到训练后的初始码本,随后转到步骤(6);如果当前视频图像是视频的第50帧图像,则对训练后的初始码本进行精炼得到初始背景码本,随后转到步骤(6);(4)根据步骤(3)建好的背景码本模型,采用背景相减法,进行红外运动目标检测,得到当前视频图像的红外运动目标检测结果;(5)根据更新理论更新主码本M和缓存码本H,得到更新后的主码本M和缓存码本H;(6)对当前视频图像的三层图像中的中间层和高斯顶层的红外运动目标检测结果进行高斯金字塔EXPAND运算,得到当前视频图像的三层还原检测图像;(7)对步骤(6)中三层还原检测图像进行融合运算,得到去除背景的红外运动目标检测视频图像;(8)如果当前视频图像不是视频的最后一帧图像,则对下一帧图像从步骤(2)开始处理;如果当前视频图像是视频的最后一帧图像,则该视频的红外运动目标检测处理结束,得到红外视频的运动目标检测结果。本专利技术与现有技术相比,其显著优点:(1)通过对视频图像做三层高斯金字塔分解,再分别对分解后的视频图像建立码本模型,进行运动目标检测,将得到不同尺度下的运动目标检测结果,最后将不同尺度下的运动目标检测结果融合得到总体的运动目标检测结果,同时利用了视频图像的像素信息和空间尺度信息。(2)在码本模型中的更新中,建立了缓存码本,通过对缓存码本和主码本的更新来实现背景模型的更新,使得背景模型具有抗扰动性、自适应更新特性。附图说明图1是本专利技术基于多尺度码本模型的红外运动目标检测方法的流程图。图2是本专利技术高斯图像金字塔示意图。图3是本专利技术初始码本训练流程图。图4是本专利技术运动目标检测及码本更新流程图。图5是本专利技术方法的仿真模型。图6是本专利技术方法仿真输入视频原始图像。图7是本专利技术方法仿真结果图像。图8是本专利技术方法包含图像背景的仿真结果。图9是本专利技术所对比其它算法的仿真结果图像。具体实施方式下面结合附图对本专利技术作进一步详细描述。结合图1,本专利技术基于多尺度码本模型的红外运动目标检测方法包括以下步骤:步骤1、利用红外焦平面及其控制模块采集红外视频,摄像头输出为PAL制720×576像素的视频源,将该视频输入到计算机中,作为红外视频。步骤2、采用高斯金字塔图像分层模型对红外视频进行多尺度分析处理,对于红外视频,记为{Fig1,Fig2,…,FigN},表示N帧视频序列,将每一帧图像采用5×5的高斯模板进行高斯金字塔分解,分为3层,原始层为G0,中间层为G1,高斯顶层为G2。每一层的高斯塔形分解可以表示为:其中k=0,1,2(32)5×5的高斯模板w(m,n)应满足以下性质:①可分离性:w(m,n)=w(m)w(n)②对称性:w(m)=w(-m)③归一化性:计算得到5×5的高斯模板w(m,n)如下所示:图像金字塔的示意图如图2所示。步骤3、如果当前视频图像是视频的第一帧,则首先建立空的主码本M和缓存码本H,缓存码本H和主码本M的结构完全一样。由于视频图像是灰度图像,检测过程中利用其像素信息,有别于RGB空间的码字描述方法,码本用集合C表示,码字采用VL和auxL=(Imin,Ima本文档来自技高网
...
基于多尺度码本模型的红外运动目标检测方法

【技术保护点】

【技术特征摘要】
1.一种基于多尺度码本模型的红外运动目标检测方法,其特征在于,所述方法包括以下步骤:(1)利用红外摄像头采集视频,输入到计算机中,得到红外视频;(2)采用高斯金字塔图像分层模型对红外视频图像进行多尺度分析处理,将视频图像分为三层:原始层、中间层和高斯顶层;(3)如果当前视频图像是视频的前50帧图像,对步骤(2)中的三层视频图像分别建立初始背景码本模型,前50帧视频的红外运动目标检测结果为视频图像本身,如果当前视频图像不是视频的前50帧图像,则转到步骤(4):如果当前视频图像是视频的第1帧图像,则先建立空的主码本M和缓存码本H,然后将第一帧图像像素值放入初始的主码本M中,得到初始码本,随后转到步骤(6);如果当前视频图像是视频的第2-49帧图像中的一帧,对三层视频图像分别进行初始码本训练,得到训练后的初始码本,随后转到步骤(6);如果当前视频图像是视频的第50帧图像,则对训练后的初始码本进行精炼得到初始背景码本,随后转到步骤(6);(4)根据步骤(3)建好的背景码本模型,采用背景相减法,进行红外运动目标检测,得到当前视频图像的红外运动目标检测结果;(5)根据更新理论更新主码本M和缓存码本H,得到更新后的主码本M和缓存码本H;(6)对当前视频图像的三层图像中的中间层和高斯顶层的红外运动目标检测结果进行高斯金字塔EXPAND运算,得到当前视频图像的三层还原检测图像;(7)对步骤(6)中三层还原检测图像进行融合运算,得到去除背景的红外运动目标检测视频图像;(8)如果当前视频图像不是视频的最后一帧图像,则对下一帧图像从步骤(2)开始处理;如果当前视频图像是视频的最后一帧图像,则该视频的红外运动目标检测处理结束,得到红外视频的运动目标检测结果。2.根据权利要求1所述的基于多尺度码本模型的红外运动目标检测方法,其特征在于,步骤(2)采用高斯金字塔图像分层模型对采集到的红外视频进行多尺度分析处理的步骤为:第一:采用5×5的高斯模板w(m,n),根据高斯模板的性质:①可分离性:w(m,n)=w(m)w(n)②对称性:w(m)=w(-m)③归一化性:计算得到5×5的高斯模板w(m,n)如下所示:第二:对于输入的红外视频,记为{Fig1,Fig2,…,FigN},表示N帧视频图像,对每一帧视频图像采用5×5的高斯模板进行高斯金字塔分解,分为3层,原始层为G0,中间层为G1,高斯顶层为G2;每一层的高斯塔形分解表示为:其中k=0,1,2(2)式中i,j分别表示视频图像像素的横坐标和纵坐标。3.根据权利要求1所述的基于多尺度码本模型的红外运动目标检测方法,其特征在于,步骤(3)对步骤(2)中的三层视频图像分别建立初始背景码本模型的步骤为:第一:码本记为集合C,码本中码字采用VL和auxL=(Imin,Imax,f,λ,p,Tlast)来描述;初始化,将每个像素的码本置空,即L=0;其中,VL表示第L个码字的灰度值;auxL表示第L个码字的结构体,其包含六个元素,分别为:Imin、Imax分别表示码字最小、最大灰度值;f表示码字出现的频率;λ表示码字相邻两次访问的最大时间间隔;p,Tlast分别表示码字在视频中第一次和最后一次出现的时间;第二:对于视频的第1-49帧视频图像中每个像素的序列采样值xi=Ii,其中i=1,2,…N,根据式(3)在初始码本中寻找匹配码字,Ii表示当前像素值,Imin-mod≤Ii≤Imax+mod(3)其中mod为像素扰动范围;如果初始码本为空,或者不存在匹配码字,则根据公式(4)和(5)创建新的码字:L=L+1(4)此时,上式中Imin=Ii,Imax=Ii;如果存在匹配码字cm,cm的描述形式如式(6)所示:对码字按照下式进行更新:vm=(fmIm+Ii)/(1+fm)(7)Imin=(1-β)(Ii-α)+βImin(8)Imax=(1-β)(Ii+α)+βImax(9)fm=fm+1(10)λm=max{λm,t-Tlast}(11)Tlast=t(12)其中,α和β为码字像素最大、最小值更新率;第三:如果当前视频图像是视频的第50帧图像,根据下式采用f和Tlast判断标准:M={cm|cm∈(C-C∩f≤ξf∩Tlast≤40)}(13)其中,f表示码字出现的频率,Tlast表示码字最后一次出现时间,ξf为频率的精炼阈值,从训练后的初始码本中删除频率小于频率的精炼阈值并且最后一次出...

【专利技术属性】
技术研发人员:刘磊周亚运夏琪崔民杰黄伟
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1