一种基于支持向量机的表格图像倾斜角度确定方法技术

技术编号:30412095 阅读:19 留言:0更新日期:2021-10-20 11:46
本发明专利技术提供了一种基于支持向量机的表格图像倾斜角度确定方法,属于表格识别技术领域,首先构建水平线样本、垂直线样本、文本样本、边界点样本共4类样本,训练样本得到识别模型,然后按照行方向和列方向两个方向分段扫描表格图像,根据梯度逐点确定子图,识别子图,记录表格直线点的像素位置,采用投票算法确定行方向和列方向上的倾斜角度,给出倾斜角度对应的可信度指标,最后根据可信度指标得到最后确定的倾斜角度。本发明专利技术对表格图像中的边界噪声、图像亮度、对比度、色彩、清晰度、表格线段连续情况不敏感,不会随表格图像中文字内容的增加而增加计算时间,避免了传统的基于Radon变换、投影特征、游程跟踪方法复杂的分析处理过程,且样本调整简单,泛化性好。泛化性好。泛化性好。

【技术实现步骤摘要】
一种基于支持向量机的表格图像倾斜角度确定方法


[0001]本专利技术属于表格识别
,特别涉及一种基于支持向量机的表格图像倾斜角度确定方法。

技术介绍

[0002]本发表格图像是一类特殊的文档图像,表格图像识别在办公自动化领域具有非常重要的意义(例如发票的归档、调查问卷自动统计等领域)。表格图像的预处理过程中,倾斜角度的确定是非常关键的步骤,直接影响后续表格分析、识别的准确率。专利CN2018112437506提供了一种票据方向检测矫正方法及自动检票系统,采用特征区域聚类算法和Radon变换对票据方向进行检测和矫正,能够消除图像本身复杂背景、方向特征区域邻域像素点对方向检测的干扰,有利于票面自动化识别系统中信息区域的定位与切割,实用性强、适用面广。专利CN2018108576099提供了一种表格识别方法和系统,基于透视变换的倾斜校正算法进行倾斜校正。专利CN2016105931193提供了一种基于图像中表格分析技术的表格鉴别和定位方法,使用合适的表格图像包围框对图像进行倾斜矫正。文献基于游程的倾斜表格图像的快速检测和校正(管继斌,明德烈,华中科技大学学报(自然科学版),2005(08),P69

71),使用游程的方法确定表格图像的倾斜角度,对游程分布直方图分析,检索出行最长游程组,根据行最长游程组的最大旋转角计算出表格图像倾斜的角度,基于实际表格图像倾斜角度一般不会过大的特点,提出了基于线性搬移技术的校正方法,通过对行、列两个方向的分段线性搬移达到图像快速倾斜校正的目的。本专利技术提供一种基于支持向量机方法的表格图像倾斜角度确定方法,支持向量机(Support Vector Machine, SVM)是一类按监督学习方式对数据进行广义线性分类器,SVM于1964年提出,在二十世纪90年代后得到快速发展并衍生出一系列改进和扩展算法,在人像识别、文本分类等模式识别问题中有得到应用。本专利技术结合了表格图像固有的直线特性,构建了4类样本模型,借助SVM的良好泛化性能,确保了表格图像倾斜角度计算的可靠性,对表格图像中的噪声、图像亮度、对比度、色彩、清晰度、表格线段连续情况等复杂情形,只需要增加样本图像即可解决,解决方案简单高效,避免了针对不同的应用场景需要调整算法的问题,倾斜角度检测的精度为0.01角度,满足实际应用需求。

技术实现思路

[0003]表格样本图像的分类,本专利技术将表格线样本图像分为4类,分别是水平线样本、垂直线样本、文本样本、边界样本,构建样本图像的尺寸为32X32。首先使用一张不包含文字的倾斜角度为0角度的水平直线模板图像,如图1所示,该图像中含有实线和两种不同的虚线,线段宽度分别为1个像素、3个像素、5个像素,水平直线图像中的虚线用于模拟实际表格扫描图像线段不连续的情况,在扫描图像清晰度下降的情况依然能够识别表格线,将该图像从负45度至正45度旋转图像,每隔一度旋转一次,共得到91张图像(水平直线图像集,如图2所示),根据垂直直线模板图像如图3所示,生成垂直直线图像集如图4所示,根据文本模板
图像如图5所示,生成文本图像集如图6所示。
[0004]生成边界样本,边界模板图像使用一张Lena图像(如图7所示)作为边界图像集,相比水平直线模板图像和文本模板图像,边界模板图像含有大量的前景像素点,使用图像旋转的方式获取边界图像集的方法会产生非常大量的边界样本数据,增加模型训练的时间和识别计算时间,本专利技术将边界模板图像均等的分成32X32大小的图像子块,这些图像子块作为边界样本如图8所示。
[0005]生成文本样本,由水平直线图像集生成水平线样本,遍历水平直线图像集,按垂直方向分段扫描输入的图像,分段步长为32个像素,根据表格线子图确定方法,在输入的图像中把子图分割出来即为水平线样本图9所示,按照同样的方式可以得到垂直线样本图10所示,文本样本图11所示,样本图像的尺寸为32X32。
[0006]行方向和列方向分段扫描,样本图像的尺寸为32X32,分段扫描的步长定义为32,分段扫描在表格线样本图像生成和表格图像倾斜角度检测过程采用相同的处理方式,扫描方向分为行方向扫描和列方向扫描,水平线样本生成采用列方向扫描,如图12所示,垂直线样本生成采用行方向扫描,如图13所示,文本样本生成同时采用行方向扫描和列方向扫描图14所示。
[0007]表格线梯度子图确定,表格图像中对应表格直线的像素数占图像总像素数的比重较少,文本图像中对应文字笔画的像素数占图像总像素数的比重较少,并且直线或者文字对应的像素其邻域梯度较大,子图的确定其基本思想是先确定一个梯度较大的像素点,如果该像素点的值低于邻域的像素值且对应的梯度大于32,如图15所示,给定需要判断的一个像素位置P,如果(P1

P)的值大于等于32或者(P2

P)的值大于等于32,则该像素位置是有效的,以该像素点的位置为中心,确定32X32的图像子块图16所示,进而完成样本生成和子块分类。
[0008]倾斜角度在投票空间中的位置,给定输入的表格图像,本专利技术按照行方向,列方向分段扫描处理图像,分别得到垂直倾斜角度和水平倾斜角度,行方向扫描处理图像时,根据表格线子图确定方法,得到一个需要判断的图像子块,使用支持向量机训练的模型识别图像子块类别,如果图像子块是垂直直线类,则该行的扫描立即结束,执行下一个扫描分段(图17所示),这样避免了大量的图像子块识别过程,有利于倾斜角度计算的效率,识别出的图像子块对应的中心点位置可能不在一条直线上,因此需要考虑倾斜角度的主方向,从而最大可能的消除噪声对倾斜角度计算的影响。假设识别得到的垂直图像子块对应的中心点位置总数为n,则两两计算这些位置决定的图像的倾斜角度,给定两个点的位置(x1,y1),(x2,y2),可计算出其倾斜角度,如式1所示,相对于垂直方向的倾斜角度,如式2所示,不在角度区间[

45,45]的不参与投票计算,如式3所示,倾斜角度在投票空间S中的位置P如式4所示。
[0009]ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)(3)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)。
[0010]倾斜角度确定,投票空间S
p
统计了计算得到的倾斜角度的分布情况,实际应用过程中,肯定会出现噪声干扰和多条的直线的影响,得到的投票空间会出现离散度高、多个峰值情况,不利于提取最佳峰值,直接提取投票空间中峰值对应的倾斜角度的方法会产生误差,因此对投票空间进行信号处理,一方面平滑信号,消除噪声,另一方面突出极值特征,使用高斯核函数(式5)的二阶导数函数(式6)与投票空间S
p 卷积,卷积后信号定义为G(t) 如式7所示,G(t) 的主峰值对应的位置L确定图像倾斜角度A如式8所示。
[0011]ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
ꢀꢀꢀ
(6)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于支持向量机的表格图像倾斜角度确定方法,其特征在于基于支持向量机的方法构建表格线样本图像,包含水平线样本,垂直线样本,文本样本和边界样本4类样本,进而训练样本得到表格线识别模型,用于表格图像的倾斜角度确定。2.根据权利要求1所述的构建表格线样本图像,其特征在于使用一张不包含文字的倾斜角度为0度的水平直线模板图像,将该图像从负45度至正45度旋转图像,每隔一度旋转一次,共得到91张图像(水平直线图像集),水平直线图像集中所有直线上的点所对应的图像子块作为水平线样本,按照同样的方式,可以得到垂直线样本。3.根据权利要求1所述的构建表格线识别样本,其特征在于使用一张仅包含文字的倾斜角度为0度的文本模板图像,将该图像从负45度至45度旋转图像,每隔一度旋转一次,共得到91张图像(文本图像集),文本图像集中图像文字上的点对应的图像子块作为文本样本。4.根据权利要求1所述的构建表格线识别样本,其特征在于使用一张自然图像,将该图像均等的分成32X32大小的图像子块,该图像子块集合作为边界样本。5.根据权利要求2,权利要求3,权利要求4所述的水平线样本,垂直线样本,文本样本,边界样本,其特征在于样本图像尺寸为32X32。6.一种基于支持向量机...

【专利技术属性】
技术研发人员:刘江李晓鹏牟少霞王华刘学慧
申请(专利权)人:山东微明信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1