一种基于可变窗口的代价聚集方法技术

技术编号:20222707 阅读:44 留言:0更新日期:2019-01-28 20:55
一种基于可变窗口的代价聚集方法,包括:步骤1:首先,采用canny边缘算法对图像进行边缘提取得到边缘位置上的点;步骤2:其次,把图像上除去边缘位置上的其他像素点作为图像的内部点,并采用四邻域连通的方式构建图像的内部点的连通域;步骤3:另外针对边缘位置上的点和图像的内部点分别构建针对边缘位置上的点的匹配窗口和针对图像的内部点的匹配窗口。有效避免了现有技术中用固定窗口进行代价聚集时产生严重的“前景膨胀”现象、多个不同形状的窗口无法适应复杂多变的图像变化、误匹配的问题。

【技术实现步骤摘要】
一种基于可变窗口的代价聚集方法
本专利技术涉及立体匹配
,具体涉及一种基于可变窗口的代价聚集方法,尤其涉及一种基于可变窗口并用于立体匹配的代价聚集方法。
技术介绍
近年来,3D(ThreeDimension)视觉领域的研究和应用得到了快速发展,尤其是在三维重构、三维检测、机器人视觉导航等方向。这些进步的关键是立体视觉技术的出现,它是使用光学手段获取一幅或者多福图像,运用图像处理算法还原出被拍摄物体的几何关系与立体形状,从而获得有关物体的三维坐标值。在立体视觉技术中,被动式的双目立体视觉系统因其设备构成简单、易搭建、不易暴露检测设备位置,且对检测对象友好等优势,在整个3D视觉领域具有举足轻重的地位,而双目立体视觉系统使用的双目立体视觉(BinocularStereoVision)技术是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。双目立体视觉技术融合两只眼睛获得的图像并观察它们之间的差别,使用户可以获得明显的深度感,建立特征间的对应关系,将同一空间物理点在不同图像中的映像点对应起来,这个差别,称作视差(Disparity)图像。双目立体视觉测量方法具有效率高、精度合适、系统结构简单、成本低等优点,非常适合于制造现场的在线、非接触产品检测和质量控制。对运动物体(包括动物和人体形体)测量中,由于图像获取是在瞬间完成的,因此立体视觉方法是一种更有效的测量方法。也就是说,双目立体视觉系统是计算机视觉的关键技术之一,获取空间三维场景的距离信息也是计算机视觉研究中最基础的内容。立体匹配是双目视觉系统的核心,同时亦是最为困难的部分。目前,立体匹配算法通常执行以下四个步骤:(1)匹配代价计算;(2)代价聚集;(3)视差计算/优化;(4)视差调整。进一步地,Scharstein和Szeliski提出过一个分类方案,将该算法分为两类:局部算法和全局算法。所有的局部算法都需要执行步骤(2),也就是执行代价聚集的方法,以实现隐式的平滑假设;与之相反,全局算法给出的是显式的平滑假设,然后求解最优化问题,这样的全局算法基本上省略了代价聚集的步骤,比较流行的全局算法包括动态规划,置信传播和图割算法。代价聚集通常采用固定大小的窗口,将当前待匹配点作为窗口的中心点,利用该中心点周围的分布信息进行匹配,根据更多的特征信息,提升算法的鲁棒性。这样做的最重要前提为局部窗口内视差是相似的。在图像前景与图像背景的边缘处,前景会发生深度的突变,而背景由于物体之间的遮挡,使背景在左右视图中并不是同时可见。在诸如这些图像区域,匹配窗口需精心地选择。如图1和图3所示,若采用固定大小的矩形窗口,那么在遮挡或深度突变区会发生“前景膨胀”现象。该现象的原因是固定窗口在这些区域匹配时,认为前景与背景处于同一深度下,背景的匹配结果就会与前景一致。为了消除这一影响,人们对固定窗口做了许多改进。Hirschmüller采用多个不同形状的窗口进行聚集,然后选择其中某一窗口的匹配结果。Veksler则将待匹配的点由窗口中心点位置换到窗口的左下角等不同位置,再重新构建窗口匹配。这些策略虽然较固定窗口而言分割效果更好,如图2所示,形成了理想的匹配窗口,但是窗口的形状与大小一般是固定的。即使使用多个不同形状的窗口聚集方式,可选窗口数量也会固定,同样无法适应复杂多变的场景变化。针对上述诸多问题,近年来对代价聚集方法的研究逐渐转向可变窗口的方式。可变窗口一般先计算中心像素点与周围像素点的相似程度,然后过滤掉与中心像素差别过大的点,因为此时,该像素有很大的几率位于另外一个物体上,与中心像素点的深度不相似。所以,可变窗口匹配算法是一个动态创建的匹配策略,其窗口的大小与形状都不是固定的。其中,最常用的方法是KeZhang提出的十字交叉式可变窗口匹配算法。图4为该十字交叉式可变窗口匹配算法的构建策略:它以中心像素点为基准,对周围像素点先做水平扫描,当遇见与中心像素点相差过大的像素时扫描停止;接着以水平扫描的结果为基准,做垂直扫描,同样,若当前点与起始点相差过大,则扫描停止。图5为其聚集结果。这种构建窗口的好处在于,首先窗口形状可变,尽可能地符合了当前物体的边缘形状,减少了窗口内其余物体出现的情况,其次在于连续的像素在匹配代价计算时能很方便的采用类似积分图等方式加速。其缺点在于,对于一些特殊情况,例如斜向的细长杆、像素点过少的小物体等容易由于匹配窗口过小,无法得到足够对的匹配信息,导致无匹配的情况出现。
技术实现思路
为解决上述问题,本专利技术提供了一种基于可变窗口的代价聚集方法,该方法先对像素点分类,根据实际情况采用不同的匹配窗口构建算法进行匹配的代价聚集方法。为了克服现有技术中的不足,本专利技术提供了一种基于可变窗口的代价聚集方法的解决方案,具体如下:一种基于可变窗口的代价聚集方法,步骤如下:步骤1:首先,采用canny边缘算法对图像进行边缘提取得到边缘位置上的点;步骤2:其次,把图像上除去边缘位置上的其他像素点作为图像的内部点,并采用四邻域连通的方式构建图像的内部点的连通域;步骤3:另外针对边缘位置上的点和图像的内部点分别构建针对边缘位置上的点的匹配窗口和针对图像的内部点的匹配窗口。进一步地,所述边缘算法为canny边缘算法,所述canny边缘算法先计算图像各像素点的梯度幅值和图像的梯度方向,再根据所述图像的梯度方向对所述图像各像素点的梯度幅值进行非极大值抑制;接着用双阈值算法检测和连接边缘来滤去图像中的噪点,也就是利用边缘连接与大小阈值的思路来滤去图像中的噪点,最后得到单像素宽的边缘。进一步地,所述针对边缘位置上的点构建针对边缘位置上的点的匹配窗口的方式为:把边缘位置上的点逐一作为起始像素点,对每个起始像素点均执行如下进程:从起始像素点开始,以深度优先搜索DFS算法在起始像素点的四邻域内把边缘点搜索出来,直到在起始像素点的四邻域内搜索不到边缘点或者在结合空间域条件下当前像素点与起始像素点之间的像素值差异在值域上差别过大时则停止搜索,而搜索出来的边缘点就构成了该起始像素点的匹配窗口,其中,所述当前像素点为正在进行搜索的那个边缘点。进一步地,所述在结合空间域条件下当前像素点与起始像素点之间的像素值差异在值域上差别过大时则搜索停止的方式为:利用公式(1)来判断当前像素点与起始像素点之间的像素值差异是否超过值域阈值λ,公式(1)如下:maxC∈{R,G,B}(Ic(p)-Ic(q))>λ(1)若超过值域阈值λ,就表明当前像素点与起始像素点之间的像素值差异在值域上差别过大,则搜索停止,若未超过值域阈值λ,就表明当前像素点与起始像素点之间的像素值差异在值域上差别并未过大,则搜索就不停止,其中,maxC∈{R,G,B}(Ic(p)-Ic(q))就用来表达当前像素点与起始像素点之间的像素值差异,p为起始像素点,q为当前像素点,Ic(p)-Ic(q)表示起始像素点的三原色分量值分别减去当前像素点的三原色分量值得到的三原色分量差值,也即起始像素点的三原色中的红色分量值减去当前像素点的三原色中的红色分量值得到的红色分量差值,起始像素点的三原色中的绿色分量值减去当前像素点的三原色中的绿色分量值得到的本文档来自技高网
...

【技术保护点】
1.一种基于可变窗口的代价聚集方法,其特征在于,步骤如下:步骤1:首先,采用canny边缘算法对图像进行边缘提取得到边缘位置上的点;步骤2:其次,把图像上除去边缘位置上的其他像素点作为图像的内部点,并采用四邻域连通的方式构建图像的内部点的连通域;步骤3:另外针对边缘位置上的点和图像的内部点分别构建针对边缘位置上的点的匹配窗口和针对图像的内部点的匹配窗口。

【技术特征摘要】
1.一种基于可变窗口的代价聚集方法,其特征在于,步骤如下:步骤1:首先,采用canny边缘算法对图像进行边缘提取得到边缘位置上的点;步骤2:其次,把图像上除去边缘位置上的其他像素点作为图像的内部点,并采用四邻域连通的方式构建图像的内部点的连通域;步骤3:另外针对边缘位置上的点和图像的内部点分别构建针对边缘位置上的点的匹配窗口和针对图像的内部点的匹配窗口。2.根据权利要求1所述的基于可变窗口的代价聚集方法,其特征在于,所述边缘算法为canny边缘算法,所述canny边缘算法先计算图像各像素点的梯度幅值和图像的梯度方向,再根据所述图像的梯度方向对所述图像各像素点的梯度幅值进行非极大值抑制;接着用双阈值算法检测和连接边缘来滤去图像中的噪点,也就是利用边缘连接与大小阈值的思路来滤去图像中的噪点,最后得到单像素宽的边缘。3.根据权利要求2所述的基于可变窗口的代价聚集方法,其特征在于,所述针对边缘位置上的点构建针对边缘位置上的点的匹配窗口的方式为:把边缘位置上的点逐一作为起始像素点,对每个起始像素点均执行如下进程:从起始像素点开始,以深度优先搜索DFS算法在起始像素点的四邻域内把边缘点搜索出来,直到在起始像素点的四邻域内搜索不到边缘点或者在结合空间域条件下当前像素点与起始像素点之间的像素值差异在值域上差别过大时则停止搜索,而搜索出来的边缘点就构成了该起始像素点的匹配窗口,其中,所述当前像素点为正在进行搜索的那个边缘点。4.根据权利要求3所述的基于可变窗口的代价聚集方法,其特征在于,所述在结合空间域条件下当前像素点与起始像素点之间的像素值差异在值域上差别过大时则搜索停止的方式为:利用公式(1)来判断当前像素点与起始像素点之间的像素值差异是否超过值域阈值λ,公式(1)如下:maxC∈{R,G,B}(Ic(p)-Ic(q))>λ(1)若超过值域阈值λ,就表明当前像素点与起始像素点之间的像素值差异在值域上差别过大,则搜索停止,若未超过值域阈值λ,就表明当前像素点与起始像素点之间的像素值差异在值域上差别并未过大,则搜索就不停止,其中,maxC∈{R,G,B}(Ic(p)-Ic(q))就用来表达当前像素点与起始像素点之间的像素值差异,p为起始像素点,q为当前像素点,Ic(p)-Ic(p)表示起始像素点的三原色分量值分别减去当前像素点的三原色分量值得到的三原色分量差值,也即起始像素点的三原色中的红色分量值减去当前像素点的三原色中的红色分量值得到的红色分量差值,起始像素点的三原色中的绿色分量值减去当前像素点的三原色中的绿色分量值得到的绿色分量差值,起始像素点的三原色中的蓝色分量值减去当前像素点的三原色中的蓝色分量值得到的蓝色分量差值,红色分量差值、绿色分量差值和蓝色分量差值就组成了三原色分量差值,Ic(p)和Ic(p)分别表示起始像素点的三原色分量值和当前像素点的三原色分量值,c为R、G或B,当c为R时,Ic(p)所表示的起始像素点的三原色分量值就为起始像素点的三原色中的红色分量值,Ic(q)所表示的当前像素点的三原色分量值就为当前像素点的三原色中的红色分量值,当c为G时,Ic(p)所表示的起始像素点的三原色分量值就为起始像素点的三原色中的绿色分量值,Ic(q)所表示的当前像素点的三原色分量值就为当前像素点的三原色中的绿色分量值,当c为B时,Ic(p)所表示的起始像素点的三原色分量值就为起始像素点的三原色中的蓝色分量值,Ic(q)所表示的当前像素点的三原色分量值就为当前像素点的三原色中的蓝色分量值,而用来表达当前像素点与起始像素点之间的像素值差异的maxC∈{R,G,B}(Ic(p)-Ic(q))就为红色分量差值、绿色分量差值和蓝色分量差值中的最大值,λ为值域阈值,λ由公式(2)和公式(3)限定:D=max(x(p)-x(q),y(p)-y(q))(3)x(p)表示起始像素点的横坐标,x(q)表示当前像素点的横坐标,y(p)表示起始像素点的纵坐标,y(q)表示当前像素点的纵坐标,D表示横向的距离和纵向的距离中的最大值,其中横向的距离表示起始像素点的横坐标和当前像素点的纵坐标的差值,纵向的距离表示起始坐标点的纵坐标和当前像素点的纵坐标的差值,λ1的值大于λ2的值,d1和d2...

【专利技术属性】
技术研发人员:董学广杨艺张勇
申请(专利权)人:深圳市凌云视迅科技有限责任公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1