一种基于支持向量机的表格图像倾斜角度确定方法技术

技术编号:30412095 阅读:32 留言:0更新日期:2021-10-20 11:46
本发明专利技术提供了一种基于支持向量机的表格图像倾斜角度确定方法,属于表格识别技术领域,首先构建水平线样本、垂直线样本、文本样本、边界点样本共4类样本,训练样本得到识别模型,然后按照行方向和列方向两个方向分段扫描表格图像,根据梯度逐点确定子图,识别子图,记录表格直线点的像素位置,采用投票算法确定行方向和列方向上的倾斜角度,给出倾斜角度对应的可信度指标,最后根据可信度指标得到最后确定的倾斜角度。本发明专利技术对表格图像中的边界噪声、图像亮度、对比度、色彩、清晰度、表格线段连续情况不敏感,不会随表格图像中文字内容的增加而增加计算时间,避免了传统的基于Radon变换、投影特征、游程跟踪方法复杂的分析处理过程,且样本调整简单,泛化性好。泛化性好。泛化性好。

【技术实现步骤摘要】
一种基于支持向量机的表格图像倾斜角度确定方法


[0001]本专利技术属于表格识别
,特别涉及一种基于支持向量机的表格图像倾斜角度确定方法。

技术介绍

[0002]本发表格图像是一类特殊的文档图像,表格图像识别在办公自动化领域具有非常重要的意义(例如发票的归档、调查问卷自动统计等领域)。表格图像的预处理过程中,倾斜角度的确定是非常关键的步骤,直接影响后续表格分析、识别的准确率。专利CN2018112437506提供了一种票据方向检测矫正方法及自动检票系统,采用特征区域聚类算法和Radon变换对票据方向进行检测和矫正,能够消除图像本身复杂背景、方向特征区域邻域像素点对方向检测的干扰,有利于票面自动化识别系统中信息区域的定位与切割,实用性强、适用面广。专利CN2018108576099提供了一种表格识别方法和系统,基于透视变换的倾斜校正算法进行倾斜校正。专利CN2016105931193提供了一种基于图像中表格分析技术的表格鉴别和定位方法,使用合适的表格图像包围框对图像进行倾斜矫正。文献基于游程的倾斜表格图像的快速检测和校正(管继斌,明德烈,华本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于支持向量机的表格图像倾斜角度确定方法,其特征在于基于支持向量机的方法构建表格线样本图像,包含水平线样本,垂直线样本,文本样本和边界样本4类样本,进而训练样本得到表格线识别模型,用于表格图像的倾斜角度确定。2.根据权利要求1所述的构建表格线样本图像,其特征在于使用一张不包含文字的倾斜角度为0度的水平直线模板图像,将该图像从负45度至正45度旋转图像,每隔一度旋转一次,共得到91张图像(水平直线图像集),水平直线图像集中所有直线上的点所对应的图像子块作为水平线样本,按照同样的方式,可以得到垂直线样本。3.根据权利要求1所述的构建表格线识别样本,其特征在于使用一张仅包含文字的倾斜角度为0度的文本模板图像,将该图像从负45度至45度旋转图像,每隔一度旋转一次,共得到91张图像(文本图像集),文本图像集中图像文字上的点对应的图像子块作为文本样本。4.根据权利要求1所述的构建表格线识别样本,其特征在于使用一张自然图像,将该图像均等的分成32X32大小的图像子块,该图像子块集合作为边界样本。5.根据权利要求2,权利要求3,权利要求4所述的水平线样本,垂直线样本,文本样本,边界样本,其特征在于样本图像尺寸为32X32。6.一种基于支持向量机...

【专利技术属性】
技术研发人员:刘江李晓鹏牟少霞王华刘学慧
申请(专利权)人:山东微明信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1