一种适用于目标识别的物体预测区域优化方法技术

技术编号:13132881 阅读:73 留言:0更新日期:2016-04-06 18:55
本发明专利技术公开了一种适用于目标识别的物体预测区域优化方法,该方法通过对物体预测区域膨胀,然后进行图像分割,接着进行超像素包围盒计算和超像素显著性评价,最后基于超像素的滑窗搜索,最终得到优化后的物体预测区域。本发明专利技术通过控制超像素的尺寸可以增大图像分割的尺度,从而降低超像素的搜索范围,因此本算法的时间复杂度较小,只与图像中超像素的数目有关;由于超像素中的像素具有一致性,且对局部边缘的分割更好,因此相比于单一像素点,将超像素作为滑窗搜索的基本元素可以产生更好的定位效果;本发明专利技术可以有效降低搜索区域,从而加速传统基于像素点的滑窗搜索算法;另外,通过级联本发明专利技术的方法,可以提高现有目标识别算法对目标的识别精度。

【技术实现步骤摘要】

本专利技术属于图像处理与计算机视觉领域,具体涉及一种适用于目标识别的物体预测区域优化方法
技术介绍
视觉是人类获取外界信息的重要途径,而图像则是信息的重要载体。随着图像处理技术的日益发展,图像的尺寸、分辨率逐渐增大,其包含的信息也在不断丰富。研究表明,人类在观察图像时视线通常在图像所包含的物体之间移动,而对背景等其他区域并不感兴趣,大部分的视觉技术,如行人检测、人脸识别、目标跟踪和目标识别等,也是作用于上述包含物体的区域。因此如何在整幅图像中快速、有效地定位感兴趣物体区域的位置具有重要的研究意义。目标定位是图像理解、目标识别领域的重要内容,主要包括将物体从背景区域分离,分析图像中物体间的相对位置关系等,其中基于滑窗搜索的方法在目标定位中应用最为广泛。上述方法将分类函数应用于不同位置、尺度和长宽比下的窗口,具有最大响应的窗口视为物体的预测区域。但基于滑窗搜索的方法在实际应用中主要面临两个问题:1、由于要搜索整幅图像,并在所有可能的位置应用分类器,算法的时间复杂度较高;2、如何有效地训练具有位置判别特征的分类器仍需要进一步研究。对于第一个问题,现有的改进大都采用启发式算法加快搜索过程,但会增大物体区域误检的概率。因此采用一种运行速度快、误检率低的搜索方法,同时保证检测结果与实际物体尽可能吻合,具有十分重要的意义。本专利技术基于SLIC(SimpleLinearIterativeClustering)方法和物体分布的统计特性,通过与传统滑窗搜索算法的比较,进一步验证了本算法在目标定位精度、运行效率上的优势,同时算法对噪声具有一定的鲁棒性,有广泛的应用前景。
技术实现思路
本专利技术的目的在于弥补现有目标定位算法在运行速度、适应范围和鲁棒性上的不足,提供一种无需标记信息,并实现图像目标快速定位的适用于目标识别的物体预测区域优化方法。为达到上述目的,本专利技术采用以下技术方案予以实现:一种适用于目标识别的物体预测区域优化方法,包括以下步骤:1)物体预测区域膨胀:对预测区域进行膨胀,使膨胀后的区域能够包含完整的物体,进而对物体进行精确定位;2)图像分割:选取包含目标的图像作为待处理图像,应用SLIC算法将图像分割为多个超像素,超像素尺寸为其中M表示图像包含的像素总数,N表示超像素的总数目;对于任一超像素,其特征与当前超像素内像素特征之间的欧氏距离小于与其他超像素内像素特征之间的欧氏距离;超像素互不重合,且有唯一的标记信息i(i=0,1,2,…N-1);其中,任一超像素的特征表示为(l,a,b,x,y),其中l,a,b表示CIELAB颜色空间的值,x,y表示距图像中心的位置;3)超像素包围盒计算:选取i=0所对应的超像素区域xi,计算xi中所有像素点横坐标的最小值作为包围盒的左边界,最大值作为包围盒的右边界;同理,计算xi中所有像素点纵坐标的最小值作为包围盒的上边界,最大值作为包围盒的下边界;依次遍历N个超像素,得到所有超像素对应的包围盒;4)超像素显著性评价:对图像中的每一超像素进行显著性评价;5)基于超像素的滑窗搜索:从步骤3得到的所有超像素的包围盒边界出发,得到滑窗左上角和右下角顶点分布的位置集合;采用不同长宽比下的滑窗在图像中的不同位置进行搜索,滑窗左上角和右下角顶点的位置应从对应集合中选取,而非按像素移动;对于当前滑窗,滑窗响应表示为当前窗口所包含的超像素显著性的和,最大响应对应的滑窗即为优化后的物体预测区域。本专利技术进一步的改进在于:所述步骤1)中,物体预测区域膨胀的具体方法如下:1-1)从标准数据集中选取15,000个目标的真实标记信息,统计得到包围盒的基准尺寸wb,hb;1-2)计算当前预测区域的宽度wi和高度hi,若wi>hi,则执行1-3),否则执行1-4);1-3)通过Sigmoid函数计算沿宽度方向的膨胀系数α:α=λ11+exp(-λ2wi)+λ3]]>其中,λ1和λ3用于控制膨胀系数的上下界,λ2用于控制α的变化速度;通过wα=hβ计算得到沿高度方向的膨胀系数β;1-4)通过Sigmoid函数计算沿高度方向的膨胀系数β:β=λ11+exp(-λ2hi)+λ3]]>其中,λ1和λ3用于控制膨胀系数的上下界,λ2用于控制α的变化速度;通过wα=hβ计算得到沿宽度方向的膨胀系数α;1-5)对预测区域进行膨胀,膨胀后预测区域的左上角顶点位置为右下角顶点位置为所述步骤2)中,图像分割的具体方法如下:2-1)按固定采样步长s初始化聚类中心点,每个像素的标记设为-1,距最近中心点的距离设为正无穷;2-2)对每一个中心点,计算其2s×2s邻域中每个像素点距此中心点的距离,并与该像素点已有的距离进行比较,较小的值设为当前像素点的距离,并保持像素点标记与该聚类中心点标记一致;2-3)更新聚类中心点,计算分割误差;2-4)重复执行步骤2-2)和2-3),直到误差小于预先设定的阈值。所述步骤4)中,显著性评价包括颜色差异和中心先验;颜色差异:将超像素与背景超像素依次比较,若差异值小于所有超像素差异值的平均值,则当前超像素属于非物体区域;否则,属于物体区域;颜色差异ri定义为:ri=1NbΣj=1Nbd(si,bj)]]>其中,Nb表示紧邻图像边界的超像素的数目,d(si,bj)表示当前超像素si和边界超像素bj在CIELAB和RGB颜色空间平均值的χ2距离,为:d(si,bj)=Σk=1n2(sik-bjk)2sik+bjk]]>其中,n表示颜色空间的维度;中心先验:引入高斯权重函数,定义为:wi=exp(-λxxi2w2-λyyi2h2)]]>其中,w,h分别表示图像的宽度和高度,xi,yi表示第i个超像素中所有像素点距图像中心点的平均距离,λx,λy用于调整滑窗的不同维度对权重变化的影响;当前超像素区域的显著性表示为其颜色差异和中心先验的乘积,即:fi=ri·wi。与现有技术相比,本专利技术具有以下有益效果:本专利技术通过控制超像素的尺寸可以增大图像分割的尺度,从而降低超像素的搜索范围,因此本算法的时间复杂度较小,只与图像中超像素的数目有关;由于超像素中的像素具有一致性,且对局部边缘的分割更好,因此相比于单一像素点,将超像素作为滑窗搜索的基本元素可以产生更好的定位效果;本文档来自技高网
...

【技术保护点】
一种适用于目标识别的物体预测区域优化方法,其特征在于,包括以下步骤:1)物体预测区域膨胀:对预测区域进行膨胀,使膨胀后的区域能够包含完整的物体,进而对物体进行精确定位;2)图像分割:选取包含目标的图像作为待处理图像,应用SLIC算法将图像分割为多个超像素,超像素尺寸为其中M表示图像包含的像素总数,N表示超像素的总数目;对于任一超像素,其特征与当前超像素内像素特征之间的欧氏距离小于与其他超像素内像素特征之间的欧氏距离;超像素互不重合,且有唯一的标记信息i(i=0,1,2,…N‑1);其中,任一超像素的特征表示为(l,a,b,x,y),其中l,a,b表示CIELAB颜色空间的值,x,y表示距图像中心的位置;3)超像素包围盒计算:选取i=0所对应的超像素区域xi,计算xi中所有像素点横坐标的最小值作为包围盒的左边界,最大值作为包围盒的右边界;同理,计算xi中所有像素点纵坐标的最小值作为包围盒的上边界,最大值作为包围盒的下边界;依次遍历N个超像素,得到所有超像素对应的包围盒;4)超像素显著性评价:对图像中的每一超像素进行显著性评价;5)基于超像素的滑窗搜索:从步骤3得到的所有超像素的包围盒边界出发,得到滑窗左上角和右下角顶点分布的位置集合;采用不同长宽比下的滑窗在图像中的不同位置进行搜索,滑窗左上角和右下角顶点的位置应从对应集合中选取,而非按像素移动;对于当前滑窗,滑窗响应表示为当前窗口所包含的超像素显著性的和,最大响应对应的滑窗即为优化后的物体预测区域。...

【技术特征摘要】
1.一种适用于目标识别的物体预测区域优化方法,其特征在于,包括以下步骤:
1)物体预测区域膨胀:
对预测区域进行膨胀,使膨胀后的区域能够包含完整的物体,进而对物体进行精确定
位;
2)图像分割:
选取包含目标的图像作为待处理图像,应用SLIC算法将图像分割为多个超像素,超像
素尺寸为其中M表示图像包含的像素总数,N表示超像素的总数目;对于任一
超像素,其特征与当前超像素内像素特征之间的欧氏距离小于与其他超像素内像素特征之
间的欧氏距离;超像素互不重合,且有唯一的标记信息i(i=0,1,2,…N-1);其中,任一超像
素的特征表示为(l,a,b,x,y),其中l,a,b表示CIELAB颜色空间的值,x,y表示距图像中心的
位置;
3)超像素包围盒计算:
选取i=0所对应的超像素区域xi,计算xi中所有像素点横坐标的最小值作为包围盒的
左边界,最大值作为包围盒的右边界;同理,计算xi中所有像素点纵坐标的最小值作为包围
盒的上边界,最大值作为包围盒的下边界;依次遍历N个超像素,得到所有超像素对应的包
围盒;
4)超像素显著性评价:
对图像中的每一超像素进行显著性评价;
5)基于超像素的滑窗搜索:
从步骤3得到的所有超像素的包围盒边界出发,得到滑窗左上角和右下角顶点分布的
位置集合;采用不同长宽比下的滑窗在图像中的不同位置进行搜索,滑窗左上角和右下角
顶点的位置应从对应集合中选取,而非按像素移动;
对于当前滑窗,滑窗响应表示为当前窗口所包含的超像素显著性的和,最大响应对应
的滑窗即为优化后的物体预测区域。
2.根据权利要求1所述的适用于目标识别的物体预测区域优化方法,其特征在于,所述
步骤1)中,物体预测区域膨胀的具体方法如下:
1-1)从标准数据集中选取15,000个目标的真实标记信息,统计得到包围盒的基准尺寸
wb,hb;
1-2)计算当前预测区域的宽度wi和高度hi,若wi>hi,则执行1-3),否则执行1-4);
1-3)通过Sigmoid函数计算沿宽度方向的膨胀系数α:
α=L1+exp(-λ2wi)+λ3]]>其中,λ1和λ3用于控制膨胀系数的上下界,λ2用于控制α的变化速度;...

【专利技术属性】
技术研发人员:黄攀峰陈路蔡佳孟中杰张彬刘正雄
申请(专利权)人:西北工业大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1