【技术实现步骤摘要】
一种基于数字图像处理技术的全线表结构识别方法
[0001]本专利技术属于数字图像处理
,公开了一种基于数字图像处理技术的全线表结构识别方法。
技术介绍
[0002]信息时代的高速发展导致了数据的大量产生与频繁传输,单单依靠人力处理庞大繁杂的数据耗时耗力,很难高效地处理这些数据。随着人工智能的兴起与发展,数据的利用变得更加高效。表格通常用于在文档中显示结构化数据,因其能直观、有效的传达信息而被广泛的应用到各个场景中,人们可以快速地从表格中提取有效信息,使得信息交互更为方便,而单元格的位置以及它们如何被组织成列和行,是文档理解和信息提取的关键部分,因此表格作为一种特殊的数据形式,逐渐引起了广泛地关注。此外,纸制表格在人们的工作生活中被广泛使用,将纸质表格转换为电子表格可以更加有效地管理、处理数据。然而,在日常生活中,基于人工处理表格的方式,产生了诸多问题:比如因为表格数量众多,类型繁多复杂,人工对数据进行更新的过程中,可能会在不同的表格中写入相同的内容,或者有些单元格里的内容没有得到更新。一旦产生错误,使用人力查找错误的时 ...
【技术保护点】
【技术特征摘要】
1.一种基于数字图像处理技术的全线表结构识别方法,其特征在于,包括以下步骤:步骤1,获取扫描的全线表表格图像,对图像进行预处理;步骤2,表格矫正处理;对图像进行预处理后,获得步骤1的图像提取最大外边框,得到顶点坐标和旋转角度,之后确定旋转矩阵,最终通过仿射变换实现图像旋转,达到矫正的目的;步骤3,对步骤2获得的矫正图像使用最大连通域的方法提取表格框架,获得表格框架图像;步骤4,表格单元格检测,对步骤3获得的表格框架图像进行单元格检测,得到每个单元格坐标信息,并且对坐标信息进行排序处理;步骤5,表头区域提取;对步骤5获得的坐标信息进行分析,得到表头区域坐标信息,通过设定阈值、计算像素点的方法,判断是否存在表头信息;步骤6,单元格分割;根据坐标信息,对感兴趣区域进行截取。2.根据权利要求1所述的基于数字图像处理技术的全线表结构识别方法,其特征在于,步骤1具体包括:步骤101,通过对纸质表格采用扫描的方法来获取对应的表格图像;图像可以是是任意的图像格式;步骤102,对表格图像进行灰度处理,将图像转成单通道灰度图像,RGB彩色图像颜色空间转成灰度图的方式表示为;GRAY=0.3R+0.59G+0.11B
…………………………………………………………
(1)步骤103,对步骤102得到的灰度图像进行二值化处理,使得表格图像像素值只有0和255两种;二值化方法的标志选择BINARY,转换规则表示为:其中x,y是像素点坐标,thresh是使用高斯法求出的阈值。3.根据权利要求2所述的基于数字图像处理技术的全线表结构识别方法,其特征在于,所述的步骤3中提取最大外边框是指:使用轮廓检测中的获取最小外接矩形的方法得到每个边框信息,显而易见地,最大外边框的最小外接矩形有着最大的面积,因此,可以通过比较面积的方法来得到最大外边框的坐标信息与旋转角度信息;所述的通过仿射变换实现图像旋转,达到矫正的目的是指:根据得到的坐标信息与旋转角度信息,计算出旋转矩阵,再通过仿射变换对表格进行矫正处理;设旋转矩阵为R,则R与旋转角度(angle)和旋转中心(center)的关系表示为:α=scale
×
cos(angle)
………………………………………………………………
(4)β=scale
×
sin(angle)
……………………………………
(5)其中,scale表示沿x轴和y轴的缩放比例。通过求得的旋转矩阵R,对图像进行仿射变换即可实现表格的矫正。4.根据权利要求3所述的基于数字图像处理技术的全线表结构识别方法,其特征在于,所述的对步骤2获得的矫正图像使用最大连通域的方法提取表格框架,获得表格框架图像,
包括以下步骤:步骤201,受到连通域的启发,对表格图像进行分析后得出:表格框架为一个连通域,且是图像中的最大连通域,通过对步骤2得到的矫正图像提取连通域,并且标记最大连通域的信息,采用掩码图像的方式,将最大连通域信息复制到掩码图像上;步骤202,通过采用形态学操作中的膨胀操作解决表格图像出现表格线断线的问题,一定程度上可以解决表格断线的情况。可表示为如下公式:该公式表示图像A用卷积模板B来进行膨胀处理,通过模板B与图像A进行卷积计算,得出B覆盖区域的像素点最小值,并用这个最小值来替代参考点的像素值。这里应当注意,膨胀操作针对的是非零像素,所以需要对Image图像取反后操作。步骤203,通过形态学操作中的开运算解决单元格中的内容部分与表格线相连的问题。5.根据权利要求4所述...
【专利技术属性】
技术研发人员:毛家发,何政权,姚定凯,高华,毛科技,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。