自然拍照条件下基于MSER的图像表格的检测方法技术

技术编号:32474918 阅读:31 留言:0更新日期:2022-03-02 09:36
本发明专利技术涉及自然拍照条件下基于MSER的图像表格的检测方法,包括步骤:S1:将采集的图像转换为灰度图像,经处理后为R(x,y);S2:对灰度图像R(x,y)作对比度增强处理,得到图像H(x,y);S3:计算灰度图像R(x,y)中字符的高度平均值;S4:检测图像中的整体表格区域,根据字符的高度平均值确定MSER算法的最小检测面积,从而获得整体表格区域轮廓;S5:利用整体表格区域轮廓的最小外接矩形和外接矩形计算透视变换矩阵,对图像进行矫正操作,计算各矫正后表格区域在图像中的坐标值;S6:采用MSERs算法检测图像畸变校正后各表格单元,对各表格单元进行行和列的归并,确定表格单元格的行坐标和列坐标。标。标。

【技术实现步骤摘要】
自然拍照条件下基于MSER的图像表格的检测方法


[0001]本专利技术涉及图像处理与光学字符识别(OCR)领域,尤其涉及一种自然拍照条件下基于MSER的图像表格的检测方法。

技术介绍

[0002]表格作为一种信息的结构化组织方式,具有高度精炼、简明、规范等特点,常用于数据记录统计、实验结果分析等。目前很多表格文档都是以图片的形式提供,将图片形式的表格信息还原成数字资料是进一步处理和数据分析的基础。
[0003]表格图像的获取设备主要包括描仪、高拍仪专用设备和手持式移动终端设备。由于移动终端设备的普及便捷性优点,人们更倾向于使用移动终端随时实现表格图像的获取和表格内容的识别。受光照不均衡、拍照角度等的影响,自然条件下采用移动终端设备拍摄的表格图像存在阴影、对比度低、表格图像畸变等问题,使自然条件下拍摄图像的表格识别比采用专用设备获取图像的表格识别更加困难。
[0004]其中Retinex图像增强算法基于“视网膜(Retina)

大脑皮层(Cortex)理论”,基本原理就是根据图像的照度/>‑
反射本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种自然拍照条件下基于MSER的图像表格的检测方法,其特征在于,包括以下步骤:S1:将采集的图像转换为灰度图像,消除图像中光照不均衡的影响,获得灰度图像R(x,y);S2:采用图像伽马变换,对所述步骤S1中获得的灰度图像R(x,y)进行对比度增强处理,得到增强处理后的灰度图像H(x,y);S3:提取灰度图像H(x,y)中的文字区域,计算图像中字符的高度平均值;S4:检测图像H(x,y)中的整体表格区域,根据所述步骤S3中获得的图像H(x,y)中字符的高度平均值确定最小检测面积,从而获得整体表格区域轮廓;S5:利用所述步骤S4中的整体表格区域轮廓的最小外接矩形和外接矩形计算透视变换矩阵,对图像进行矫正操作,计算各矫正后表格区域在图像中的坐标值;S6:检测图像畸变校正后各表格单元,对各表格单元进行行和列的归并,确定表格单元格的行坐标和列坐标。2.根据权利要求1所述的自然拍照条件下基于MSER的图像表格的检测方法,其特征在于,所述步骤S2中采用图像伽马变换对灰度图像R(x,y)进行图像增强处理的具体步骤包括:S21:对灰度图像R(x,y)进行直方图统计分析,得到直方图峰值对应的灰度级记为Maxval,灰度图像R(x,y)的最小灰度级记为Minval;S22:对灰度图像R(x,y)中的像素r(x,y)进行灰度变换至h(x,y),得到增强图像H(x,y),其中变换公式为:3.根据权利要求1所述的自然拍照条件下基于MSER的图像表格的检测方法,其特征在于,所述步骤S3中采用形态学方法和连通域分析法提取图像中的文字区域,计算图像中字符的平均高度值,具体的步为:S31:利用大津算法获得增强后灰度图像H(x,y)的二值化阈值,通过获得二值化阈值将灰度图像H(x,y)转化为二值图像,并对所述二值图像进行反转,以及对二值图像进行闭运算,闭运算核的大小可选5
×
5或7
×
7;S32:采用图像连通域提取方法提取二值图像中的连通区域,计算各连通区域的宽w和高h;根据图像中的文字相对于整体图像的尺度大小(宽W、高H)设置阈值Tw=W/10、Th=H/20,滤除w>Tw或h>Th的连通区域,获得符合条件的连通区域高度;S33:计算所有符合条件连通区域的高度平均值,所述高度平均值作为图像中字符的平均高度值H_char。4.根据权利要求3所述的自然拍照条件下基于MSER的图像表格的检测方法,其特征在于,所述步骤S4中采用MSER方法检测图像中的整体表格区域,具体步骤为:S41:设置MSER对象初始化的各参数,其中:_min_area为MSER算法检测的最小表格面积,该值根据步骤S3中获得的图像中的字符高度平均值H_char确定,设置为k1
×
H_char
×
H_char,表示待检测表格的最小面积应大于
图像中字符平均面积的k1倍;_max_area为MSER算法检测的最大表格面积,该值根据待检测表格面积占图像面积的最大比值k2确定,设置为k2
×
W
×
H,其中W、H分别为图像的宽度和高度,0<k2<1;S42:利用MSER算法获得图像中各区域的轮廓坐标值[Cent1,Cent2,

,CentN]和各轮廓对应的外接矩形坐标值[Box1,Box2,

,BoxN];S43:对所述步骤S42中获得的轮廓的所有外接矩形采用非极大值抑制算法,滤除整体表格轮廓外接矩形内的所有内接矩形,得到图像中表格的整体轮廓Contour_Table。5.根据权利要求4所述的自然拍照条件下基于MSER的图像表格的检测方法,其特征在于,所述步骤S5中具体步骤为:S51:求得表格轮廓Contour_Table的最小外接矩形RectminBox和外接矩形RectBox,对应的四个角点分别为[SrcPoint1,SrcPoint2,SrcPoint3,SrcPoint4]和最小外接矩形的四个角点[DstPoint1,DstPoint2,DstPoint3,DstPoint4];S52:[SrcPoint1,SrcPoint2,SrcPoint3,SrcPoint4]和[DstPoint1,DstPoint2,DstPoint3,DstPoint4]构成具有透视映射关系的4个点对,将所述4个对点的坐标代入透视变换公式中,求得图像的透视变换系数矩阵M,S53:利用透视变换矩阵M实现对图像H(x,y)的畸变校正,矫正后图像I(x,y)中像素坐标点(X,Y)与原图像中对应坐标点(x,y)的映射关系为:标点(X,Y)与原图像中对应坐标点(x,y)的映射关系为:6.根据权利要求5所述的自然拍照条件下基于MSER的图像表格的检测方法,其特征在于,所述步骤S6的具体步骤为:S61:采用MSER算法检测畸变矫正后图像I(x,y)的各表格单元;S611:设置MSER算法各参数,其中:_min_area:MSER检测的表格最小单元格面积,设...

【专利技术属性】
技术研发人员:王庆刚陈大龙孙羽勃夏芸王计斌孟维
申请(专利权)人:南京华苏科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1