图像主体的识别、矫正与配准方法技术

技术编号:14677013 阅读:247 留言:0更新日期:2017-02-19 03:10
本发明专利技术公开了一种图像主体的识别、矫正与配准方法。首先进行目标检测,通过观察图像特征进行阈值分割,将前景和背景大致区分开;二值化,得到黑白的二值图像,通过膨胀处理去除噪点,保留原图中车厢部分;图像特征提取,利用梯形的数学性质定位出车厢四个角的位置;透视变换,将不规则的凸四边形经由变换矩阵拉伸至规则的矩形;配准拼接,将多张箱体图片进行组合,对于有公共图像特征的,采用Opencv开源库Stitcher类完成侧面多张箱体图的拼接配准拼接或利用矩阵性质将图片增广。图像主体的识别、矫正与配准方法有利于排除背景干扰,减小箱体识别的样本集,从而提高识别效率。

【技术实现步骤摘要】

本专利技术属于图像处理技术,特别是一种基于图像特征和像素分布模式的图像主体的识别、矫正与配准方法
技术介绍
随着数学、物理学、地理学知识体系的不断完备和卫星技术、计算机技术、互联网技术等多重领域的进步,图像资料越来越多,涉及到图像的处理、存储与检索的技术是大数据时代的利器。图像主体的识别、矫正与配准方法被广泛应用于地理、航海等拥有大量零散图片数据的领域中。在交通运输领域,港口集装箱的箱体识别能有效提高运输效率,降低成本,具有极大的经济效益。而图像主体的识别、矫正与配准方法有利于排除背景干扰,减小箱体识别的样本集,从而提高识别效率。图像主体的识别、矫正与配准方法是将图片中的主体内容与无关背景分离、矫正镜头畸变、将多张含有相同特征的图片配准拼接成一张图片。该方法主要涉及图像采集和分类、图像分割、图像特征值提取、图像变换、图像配准与拼接等步骤。其中关键问题是边缘检测和图像特征值提取部分。目前在工业领域,模式识别基本基于原始图片进行直接增强、聚类、识别,但是对目标前景比例较小的图片,无法有效识别区分前景和背景,加大了处理运算过程中的误差,降低了图像分析的准确率和成功率。本文在此基础上提出先对原始图片进行目标前景的提取、矫正和投影,消除无关背景对图像处理构成的误差影响,有效提高分析识别的准确率,同时使得人机交互过程中的中间图像更加直观清晰,增强交互体验。目前在图像识别方面有统计模式识别、结构模式识别、模糊模式识别。图像分割是图像处理中的一项关键技术。1979年日本学者大津提出了基于图像灰度特性,将图像分成目标和背景两部分的自适应阈值算法(OtsuN.Athresholdselectionmethodfromgray-levelhistograms[J].Automatica,1975,11(285-296):23-27.)。1986年加利福尼亚大学的Canny教授提出了一种多级边缘检测算法,在保留原有图像属性的情况下,显著减少图像的数据规模(CannyJ.Acomputationalapproachtoedgedetection[J].IEEETransactionsonpatternanalysisandmachineintelligence,1986(6):679-698.)。图像矫正方面主要运用到数值分析方法中的插值技术,赵庆鹏和马华东分析几何畸变产生的原因,结合数值分析方法提出了一种自适应几何畸变图像矫正方案,实验证明了其算法的有效性(赵庆鹏,马华东.自适应几何畸变图像矫正方法研究[C][C]//第三届和谐人机环境联合学术会议(HHME2007)论文集.2007年,2007.)。在图像配准方面,Flussr对畸变图像的配准问题提出了自适应映射方法,提高了配准的准确率(FlusserJ.Anadaptivemethodforimageregistration[J].PatternRecognition,1992,25(1):45-54.)。
技术实现思路
本专利技术的目的在于提供一种图像主体的识别、矫正与配准方法,对集装箱的箱体进行识别、矩形矫正与配准拼接,为后期的箱体数字和残损识别排除无关背景干扰,减少样本集,提高识别效率。实现本专利技术目的的技术解决方案为:一种图像主体的识别、矫正与配准方法,步骤如下:第一步,目标检测,在原图中提取出车厢的区域。针对大部分车厢都是红色、蓝色、橙色,将图像转换到HSV空间,然后利用色调H特征将前景和背景大致区分开来。然后利用色调直方图、大津算法阈值分割将前景车厢和背景分开,得到二值图像,再通过膨胀处理去除一些噪点。最后根据二值图像保留原图中车厢部分;第二步,图像特征提取,定位出车厢四个角的位置;对黑色背景部分和白色车厢部分赋值为0-1矩阵,然后根据白色车厢部分的分布特征对黑白边界作出定位,再确认出四个角的位置;第三步,透视变换,将不规则的凸四边形拉伸至矩形。求解出变换矩阵,其功能是任意四边形和正方形的相互转换,则可以先将四边形转换成正方形,再从正方形转换为矩形;第四步,配准拼接,将多张箱体图片进行组合。采用Opencv开源库Stitcher类完成侧面多张箱体图的拼接配准拼接。对于不同面的照片,即放缩至高度相同,再利用矩阵性质将图片增广。本专利技术结合了现有的图像处理技术和算法,针对性地对集装箱箱体图片进行了预处理,优点有:(1)速度性能好。能迅速处理多张图片的矫正和拼接。(2)图片数量不限。理论上可以实现任意张图片的矫正拼接。(3)算法准确率高。在对交通领域中集装箱体图片的矫正拼接实验中,65%的样本可做到截取后的箱体侧边垂直于高和底,倾斜角约为90°,20%的样本截取后箱体侧边与底倾斜角约为85°,仅有5%的样本会截断原四边形,使效果图不完整。综上,本算法可以有效的恢复图片的线性和非线性失真,并能将图片进行有效的配准拼接。附图说明图1是本专利技术基于图像特征和像素分布模式的图像主体的识别、矫正与配准流程图图2是原图以及原图经过利用色调直方图、大津算法阈值分割将前景车厢和背景分开,得到的二值图像。图3是经过膨胀处理后的二值化图片,大量噪点被消除。图4是四边形变换到正方形的变换矩阵原理示意图。图5是集装箱图片经过矩阵变换后箱体的结果图。图6是对两张具有公共特征的图片配准拼接得到的结果图。具体实施方式下面结合附图对本专利技术作进一步详细描述。结合图1,本专利技术基于图像特征和像素分布模式的图像主体的识别、矫正与配准方法,步骤如下:第一步,目标检测,在原图中提取出车厢的区域。针对大部分车厢都是红色、蓝色、橙色,将图像转换到HSV空间,然后利用色调H特征将前景和背景大致区分开来;(1)将图像RGB空间向量(r,g,b)转换到HSV空间向量(h,s,v),然后将HSV空间的色调H向量剥离出来,形成一维灰度向量,采用公式(2)然后利用色调直方图、大津算法阈值分割将前景车厢和背景分开,得到二值图像;对于图像I(x,y),前景和背景的分割阈值记作T,属于前景的像素点数占整幅图像的比例记为ω0,其平均灰度μ0;背景像素点数占整幅图像的比例为ω1,其平均灰度为μ1;图像的总平均灰度记为μ,类间方差记为g;假设图像的背景较暗,并且图像的大小为M×N,图像中像素的灰度值小于阈值T的像素个数记作N0,像素灰度大于阈值T的像素个数记作N1,则有:N0+N1=M×Nω0+ω1=1μ=ω0×μ0+ω1×μ1g=ω0(μ0-μ)2+ω1(μ1-μ)2将倒数第二个式子代入最后一个式子,得到等价公式:g=ω0ω1(μ0-μ1)2;这就是类间方差;采用遍历的方法得到使类间方差g最大的阈值T,即为所求;得到的二值化图像如图2,可以看到白点充斥在黑色背景中,有大量噪点;(3)再通过膨胀处理去除一些噪点,膨胀算法既是用3×3的结构元素,扫描二值图像的每一个像素,用结构元素与其覆盖的二值图像做“与”运算,如果都为0,结构图像的该像素为0;否则1,结果:使二值图像扩大一圈;膨胀后图片如图3,大量噪点被消除;第二步,图像特征提取,定位出车厢四个角的位置;车厢在图片中近似于梯形,但因为背景的不纯净、车道上黄线的干扰、边缘的不稳定性,使得图像中车厢出现冗余的边界;(1)得到n行m列的0-1矩阵;由于大津算法得到的二值图像只能保证前景与本文档来自技高网
...
图像主体的识别、矫正与配准方法

【技术保护点】
一种图像主体的识别、矫正与配准方法,其特征在于步骤如下:第一步,目标检测,在原图中提取出车厢的区域;针对车厢的色彩,将图像转换到HSV空间,然后利用色调H特征将前景和背景区分开来;然后利用色调直方图、大津算法阈值分割将前景车厢和背景分开,得到二值图像,再通过膨胀处理去除一些噪点,最后根据二值图像保留原图中车厢部分;第二步,图像特征提取,定位出车厢四个角的位置;对黑色背景部分和白色车厢部分赋值为0‑1矩阵,然后根据白色车厢部分的分布特征对黑白边界作出定位,再确认出四个角的位置;第三步,透视变换,将不规则的凸四边形拉伸至矩形,求解出变换矩阵,通过矩阵运算,先将四边形转换成正方形,再从正方形转换为矩形;第四步,配准拼接,将多张箱体图片进行组合。采用Opencv开源库Stitcher类完成侧面多张箱体图的拼接配准拼接。对于不同面的照片,即放缩至高度相同,再利用矩阵性质将图片增广。

【技术特征摘要】
1.一种图像主体的识别、矫正与配准方法,其特征在于步骤如下:第一步,目标检测,在原图中提取出车厢的区域;针对车厢的色彩,将图像转换到HSV空间,然后利用色调H特征将前景和背景区分开来;然后利用色调直方图、大津算法阈值分割将前景车厢和背景分开,得到二值图像,再通过膨胀处理去除一些噪点,最后根据二值图像保留原图中车厢部分;第二步,图像特征提取,定位出车厢四个角的位置;对黑色背景部分和白色车厢部分赋值为0-1矩阵,然后根据白色车厢部分的分布特征对黑白边界作出定位,再确认出四个角的位置;第三步,透视变换,将不规则的凸四边形拉伸至矩形,求解出变换矩阵,通过矩阵运算,先将四边形转换成正方形,再从正方形转换为矩形;第四步,配准拼接,将多张箱体图片进行组合。采用Opencv开源库Stitcher类完成侧面多张箱体图的拼接配准拼接。对于不同面的照片,即放缩至高度相同,再利用矩阵性质将图片增广。2.根据权利要求1所述的图像主体的识别、矫正与配准方法,其特征在于目标检测步骤如下:第一步,将图...

【专利技术属性】
技术研发人员:吴丽丹王永利马云涛龚佳俊
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1