用于检测可视对象的方法和系统技术方案

技术编号:3599146 阅读:133 留言:0更新日期:2012-04-11 18:40
用于通过使用多个线索检测可视对象的系统和方法,包括以统计方式将来自多个源的信息组合到突起图中,其中所述信息可包括其中要检测对象或确定背景的图像中的颜色,纹理和/或动作。设定该以统计方式组合的信息的阈值,以作出关于前景/背景像素的决定。

【技术实现步骤摘要】

本专利技术涉及视频处理,尤其涉及用于检测视频中的对象的系统和方法。
技术介绍
背景减法是一种用于查找已知背景中的移动对象的方法。将进入图像与所存储的参考图像逐个像素地进行比较并计算出差值掩码(difference mask)。大多数这种算法只在非常局部的范围内工作。仅在后处理形态学阶段考虑相邻像素(在空间和时间上)。这是一个问题,特别是在使用阴影消除算法时,并且可能引起某些有纹理的对象被忽视。也就是说,相邻像素可能以相反方向(例如,一个变亮,一个变暗)调整,以使两者都不被感觉为不同于背景图案。对于这种进退两难情况的一个解决方案是不采用基于像素的阴影消除算法,取而代之的是,检测所有区域并使用后处理方法来确定某些区域是否为阴影。这可以通过仔细寻找对象周围的限制边缘来完成。然而,这可能是一项费时的工作,且用于何时从较大斑点中清除阴影部分的规则很难用公式表示。此外,在高度纹理化的环境中(例如,一些室外场景,或者在凌乱的办公室中),不论区域是怎么形成的,在区域的边界附近都可能有边缘信息。另外一种可能的后处理规则将是搜寻一个区域内部的纹理并将其与在原始背景图像中找出的纹理进行比较。然而,控制何时保留或者解除一个区域的标准是有问题的。
技术实现思路
用于通过使用多个线索(cue)检测可视对象的系统和方法包括,以统计方式将来自多个源的信息组合到突起图(saliency map)内,其中所述信息可以包括其中要检测对象的图像中的颜色、边缘差异和/或动作(motion)。该统计组合方法利用像素噪声估计来加权逐像素和局部相邻线索的作用。以统计方式组合的信息被设定阈值以作出有关前景/背景像素的决定。一种用于通过采用多个线索检测可视对象的系统包括一个视频源,其提供待处理的图像。概率确定模块基于可用信息为多个线索确定概率,以确定像素是属于对象还是背景,其中所述线索包括逐像素线索和局部相邻线索的组合。统计组合器将来自多个线索中每一个的概率组合到突起图中,以将以统计方式组合的信息用于作出关于前景或背景像素的决定。另一种用于通过采用多个线索检测可视对象的系统包括一个视频源,其提供待处理的图像。概率确定模块基于可用信息为多个线索确定概率,以确定像素是属于对象还是背景。噪声估计器估计每个线索的噪声,其中噪声估计被用于为线索导出概率。统计组合器将来自多个线索中每一个的概率组合到突起图中,以将以统计方式组合的信息用于作出关于前景或背景像素的决定。通过联系附图阅读以下的说明性实施例的详细描述,将清楚这些和其他目的,特性和优点。附图说明该公开内容提供了在以下参考附图的优选实施例的描述中的细节,其中图1是示出了用于基于多个线索检测视频中对象的说明性系统/方法的方框/流程图;以及图2是示出了用于基于多个线索检测视频中对象的说明性系统的方框图。具体实施例方式在此描述的说明性实施例以统计方式将来自多个源(线索)(例如,差异、边缘以及可选的动作)的信息组合到突起图中,然后设定该组合迹象(evidence)的阈值以产生前景/背景像素决定。例如,差异可以包括在帧之间的颜色、纹理、边缘能量或者轮廓、移动等等的变化。由于该系统和方法能直接使用边缘信息,所以纹理变化在检测中是起作用的。此外,计算和决定标准是简单的(分别是加法和阈值设定(thresholding))。在同时使用在多像素邻域(neighborhood)上计算的纹理差异和更为传统的单像素差异的系统中,可以找出组合这两种类型的差异的坚实统计基础。可以通过经相关的线索检测计算测量并传播像素通道噪声的估计实现适当的加权,以获得用于每种类型线索的相应噪声估计。这种相同的方法可以延伸以适用于附加的逐像素或局部邻域线索的组合。特别是,将动作并入到突起计算中是有利的。这就允许该系统和方法检测可能被单独的像素差异或纹理方法遗漏的具有平滑强度(intensity)梯度的对象。该系统和方法优选地估计用于各个信息源的概率,且这些概率优选地基于总体噪声估计。全局噪声估计是区别本专利技术与其它方法的一个方面。通常,所讨论的图像可能具有多于或少于3个颜色通道(例如,黑白安全照相机,或者军用多谱成像)。可以为每个可用通道(和/或另外的信息源或线索)生成噪声估计并适当地传播。应当理解的是,在各个图中所示的元件可以按照硬件,软件或其组合的各种形式实现。优选地,这些元件可在一个或多个适当编程的通用数字计算机或者具有处理器和存储器以及输入/输出接口的等同物上以软件实现。现在参考附图,其中相同的标记代表相同或类似元素。最初参考图1,一个方框/流程图示出了用于视频中的对象检测的说明性系统/方法。在概率确定中描绘的步骤可以采用任意顺序。另外,要注意的是,为边缘差异、颜色和动作计算的概率可被图像中的其它特性或信息代替或者与其组合。在功能框6,选取一张或者多张输入图像并将其提供用于处理。线索可以包含颜色/纹理,边缘差异,动作等等。除了这些线索之外,还可以使用其它线索,或者使用其它线索代替这些线索。在功能框10,与功能框8中的存储的参考图像相比,该系统说明性地通过对一个图像从整体上估计红、绿和蓝色通道中的每个通道的噪声能量来开始。在功能框12,该系统通过对输入图像中的各个像素作出最佳推测增益校正(Ic(x,y)→I′c(x,y),在此c为颜色通道r=红,g=绿,b=蓝)以校正阴影,来启动颜色处理链。该校正被局限于对应于预期的阴影(或相互反射(inter-reflection)高亮部分)深度的小范围增益。在功能框14,相对于稳定的背景图像(来自功能框8的Sc(x,y))形成多个(例如,三个)差异。随后相对于用于每个通道(Nc)的噪声估计评估这些差异,以在功能框16中确定它们与均值(假设为0)有多少标准偏差。在功能框18,给定噪声差异的正态或者高斯分布,并将噪声估计解释为这些分布的标准偏差,每个这种差异测量都可以被解释为该像素属于背景(Bc(x,y)的概率。Dc(c,y)=I′c(x,y)-S(x,y)Bc(x,y)=J*expt其中J=1/(2*pi)1/2功能框20中,如果像素颜色通道被假设为独立的,则一个像素属于背景模型的总概率(Bp(x,y))可以被建模为通道概率的乘积。如果改用对数概率(Lp(x,y)),则更易用。该公式在信息理论语境中有时被解释为关于观测值的“意外”(功能框22),Bp(x,y)=Br(x,y)*Bg(x,y)*Bb(x,y) Lp(x,y)=-log Bp(x,y)=-log Br(x,y)-log Bg(x,y)-log Bb(x,y)=/2-3*log J在此,红色通道差异Dr(x,y)被缩写为Dr,Dg和Db类似。在红色通道Nr(x,y)中的相应噪声同样地被缩写为Nr,另外两个通道噪声估计Ng和Nb类似。要注意,当Dr=Dg=Db=0时,基于颜色差异的像素的突起应是最小的,颜色差异的突起作用Ep可以被如下定义。注意,任何通道中一个标准偏差的差异产生1的Ep值。Ep(x,y)=2*Lp(x,y)+6*log J=Dr2(x,y)/Nr2+Dg2(x,y)/Ng2+Db2(x,y)/Nb2由于颜色差异引起的突起接着与由于纹理和动作引起的突起组合。要使这些新的作用能够与Ep进行比较,在功能框24中产生的输入图像的单色型式(本文档来自技高网...

【技术保护点】
一种用于通过采用多个线索检测可视对象的方法,包括以下步骤:    通过使用噪声估计作为确定像素是前景像素还是背景像素的统计概率的基础,对像素状态的多个线索进行加权,以统计方式将像素信息组合到突起图中;以及    设定以统计方式组合的像素信息的阈值,以作出关于前景/背景像素的决定。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:乔纳森H康内尔
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利