【技术实现步骤摘要】
基于多尺度码本模型的红外运动目标检测方法
本专利技术涉及一种目标检测领域的方法,特别是一种基于红外运动目标检测的检测方法。
技术介绍
红外运动目标检测具有红外成像技术抗干扰能力较强、隐蔽性良好和全天候工作等特点,在军事和民用领域都有着广泛的应用。但是通常在实际应用中,红外目标的背景是复杂多变的,这使得红外运动目标检测算法的实现成为红外系统研究过程中的一项至关重要的技术,不仅在理论方面有着极其重要的意义,在实用方面也有相当大的价值。就目前在军事体系中的应用而言,红外运动目标检测系统可以在空中(包括空-地、空-空、空-海)超远距离目标检测、军事空中导弹防御、军事目标跟踪与攻击、港口情况监视、海洋环境监视、卫星姿态监控等项目中得到应用。同时,红外运动目标检测系统还广泛应用于现代民用领域,在遥感、红外大气云图分析、红外医疗图像病理分析、航拍地面红外图像地质分析、城市红外污染分析和高速公路的车流量检测以及海面人员搜救等领域中,红外目标检测技术也充分展示出了它的强大作用。目前,比较成熟的运动目标检测算法可以分为以下三类:(1)帧差法等简单的运动目标检测算法。帧差法一般指的是前后两帧图像相减,得到的结果按一定阈值做分割,得到运动目标图像,其又可扩展为三帧差分、隔帧差分等算法。它的优点是算法原理简单,计算量小,速度快,占用系统内存较小,适合实时处理。(2)基于光流的运动目标检测算法,按照其理论基础的不同,又可分为:基于梯度的方法、基于匹配的方法、基于能量的方法和基于相位的方法。光流表达了人眼中的图像变化,其中包含了目标运动的信息,利用像素点数值大小的时域变化和相关性可以确 ...
【技术保护点】
【技术特征摘要】
1.一种基于多尺度码本模型的红外运动目标检测方法,其特征在于,所述方法包括以下步骤:(1)利用红外摄像头采集视频,输入到计算机中,得到红外视频;(2)采用高斯金字塔图像分层模型对红外视频图像进行多尺度分析处理,将视频图像分为三层:原始层、中间层和高斯顶层;(3)如果当前视频图像是视频的前50帧图像,对步骤(2)中的三层视频图像分别建立初始背景码本模型,前50帧视频的红外运动目标检测结果为视频图像本身,如果当前视频图像不是视频的前50帧图像,则转到步骤(4):如果当前视频图像是视频的第1帧图像,则先建立空的主码本M和缓存码本H,然后将第一帧图像像素值放入初始的主码本M中,得到初始码本,随后转到步骤(6);如果当前视频图像是视频的第2-49帧图像中的一帧,对三层视频图像分别进行初始码本训练,得到训练后的初始码本,随后转到步骤(6);如果当前视频图像是视频的第50帧图像,则对训练后的初始码本进行精炼得到初始背景码本,随后转到步骤(6);(4)根据步骤(3)建好的背景码本模型,采用背景相减法,进行红外运动目标检测,得到当前视频图像的红外运动目标检测结果;(5)根据更新理论更新主码本M和缓存码本H,得到更新后的主码本M和缓存码本H;(6)对当前视频图像的三层图像中的中间层和高斯顶层的红外运动目标检测结果进行高斯金字塔EXPAND运算,得到当前视频图像的三层还原检测图像;(7)对步骤(6)中三层还原检测图像进行融合运算,得到去除背景的红外运动目标检测视频图像;(8)如果当前视频图像不是视频的最后一帧图像,则对下一帧图像从步骤(2)开始处理;如果当前视频图像是视频的最后一帧图像,则该视频的红外运动目标检测处理结束,得到红外视频的运动目标检测结果。2.根据权利要求1所述的基于多尺度码本模型的红外运动目标检测方法,其特征在于,步骤(2)采用高斯金字塔图像分层模型对采集到的红外视频进行多尺度分析处理的步骤为:第一:采用5×5的高斯模板w(m,n),根据高斯模板的性质:①可分离性:w(m,n)=w(m)w(n)②对称性:w(m)=w(-m)③归一化性:计算得到5×5的高斯模板w(m,n)如下所示:第二:对于输入的红外视频,记为{Fig1,Fig2,…,FigN},表示N帧视频图像,对每一帧视频图像采用5×5的高斯模板进行高斯金字塔分解,分为3层,原始层为G0,中间层为G1,高斯顶层为G2;每一层的高斯塔形分解表示为:其中k=0,1,2(2)式中i,j分别表示视频图像像素的横坐标和纵坐标。3.根据权利要求1所述的基于多尺度码本模型的红外运动目标检测方法,其特征在于,步骤(3)对步骤(2)中的三层视频图像分别建立初始背景码本模型的步骤为:第一:码本记为集合C,码本中码字采用VL和auxL=(Imin,Imax,f,λ,p,Tlast)来描述;初始化,将每个像素的码本置空,即L=0;其中,VL表示第L个码字的灰度值;auxL表示第L个码字的结构体,其包含六个元素,分别为:Imin、Imax分别表示码字最小、最大灰度值;f表示码字出现的频率;λ表示码字相邻两次访问的最大时间间隔;p,Tlast分别表示码字在视频中第一次和最后一次出现的时间;第二:对于视频的第1-49帧视频图像中每个像素的序列采样值xi=Ii,其中i=1,2,…N,根据式(3)在初始码本中寻找匹配码字,Ii表示当前像素值,Imin-mod≤Ii≤Imax+mod(3)其中mod为像素扰动范围;如果初始码本为空,或者不存在匹配码字,则根据公式(4)和(5)创建新的码字:L=L+1(4)此时,上式中Imin=Ii,Imax=Ii;如果存在匹配码字cm,cm的描述形式如式(6)所示:对码字按照下式进行更新:vm=(fmIm+Ii)/(1+fm)(7)Imin=(1-β)(Ii-α)+βImin(8)Imax=(1-β)(Ii+α)+βImax(9)fm=fm+1(10)λm=max{λm,t-Tlast}(11)Tlast=t(12)其中,α和β为码字像素最大、最小值更新率;第三:如果当前视频图像是视频的第50帧图像,根据下式采用f和Tlast判断标准:M={cm|cm∈(C-C∩f≤ξf∩Tlast≤40)}(13)其中,f表示码字出现的频率,Tlast表示码字最后一次出现时间,ξf为频率的精炼阈值,从训练后的初始码本中删除频率小于频率的精炼阈值并且最后一次出...
【专利技术属性】
技术研发人员:刘磊,周亚运,夏琪,崔民杰,黄伟,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。