【技术实现步骤摘要】
表格图像的处理方法、系统、设备、介质和程序产品
[0001]本申请涉及图像处理
,具体涉及一种表格图像的处理方法、系统、设备、介质和程序产品。
技术介绍
[0002]目前日常工作中的表格文件占据大多数,而由于各类表格文件没有固定格式,导致识别表格中的文字变得较为复杂,现有技术中通常采用深度学习的方式学习各类表格,但需要收集大量的表格数据进行训练,这无形中增加了大量的工作。
技术实现思路
[0003]本申请旨在至少解决现有技术中存在的技术问题之一。
[0004]例如,本申请提供了一种表格图像的处理方法,利用图像直接处理表格,通过对直线的提取,从而得到无进行无纸化的数据存储可以极大地方便各类数据的存储与访问。
[0005]本申请的第一个方面提供了表格图像的处理方法,包括以下步骤:
[0006]获取表格图像;
[0007]对所述表格图像进行预处理;
[0008]提取所述表格图像内的所有的直线,根据所述直线的倾斜角度矫正所述表格图像;
[0009]检验所述直线的可用性;
[0010]去除不可用的直线,以获得具有规定格式的表格图像。
[0011]根据本申请的表格图像的处理方法,采用图像处理方法对表格进行检测和分析,能快速有效地提取图片中的表格,可适用于所有样式的表格,便于后期通过具有规定格式的表格图像辅助图像识别应用等其他操作。
[0012]进一步地,对所述表格图像进行预处理包括:
[0013]对所述表格图像进行二值化处理;< ...
【技术保护点】
【技术特征摘要】
1.一种表格图像的处理方法,其特征在于,包括以下步骤:获取表格图像;对所述表格图像进行预处理;提取所述表格图像内的所有的直线,根据所述直线的倾斜角度矫正所述表格图像;检验所述直线的可用性;去除不可用的直线,以获得具有规定格式的表格图像。2.根据权利要求1所述的处理方法,其特征在于,对所述表格图像进行预处理包括:对所述表格图像进行二值化处理;对所述表格图像进行孔洞填充。3.根据权利要求2所述的处理方法,其特征在于,对所述表格图像进行二值化处理包括:获取所述表格图像中各个像素的灰度值;比较所述各个像素的灰度值与灰度阈值的大小,以将所述各个像素分类为背景像素和字迹像素,其中,灰度值小于灰度阈值的像素为背景像素,灰度值大于灰度阈值的像素为字迹像素。4.根据权利要求3所述的处理方法,其特征在于,对所述表格图像进行二值化处理还包括将所述背景像素的灰度值置为0,将所述字迹像素的灰度值置为255。5.根据权利要求2所述的处理方法,其特征在于,对所述表格图像进行孔洞填充,包括:获取所述表格图像中的孔洞;捕获距离所述孔洞最近的像素点;查看所述像素点的灰度值,并以所述像素点的灰度值填充所述孔洞。6.根据权利要求1所述的处理方法,其特征在于,提取所述表格图像内的所有的直线,根据所述直线的倾斜角度矫正所述表格图像,包括:提取所述表格图像内的所有的直线,并对所述直线归类为横线或竖线中的至少一种;在所述表格图像上标注水平辅助线和竖直辅助线;计算每条横线与所述水平辅助线的倾斜角度α
m
;计算每条竖线与所述竖直辅助线的倾斜角度β
n
;采用最小二乘法算法计算所述表格图像在水平方向的倾斜角度θ
水平
;采用最小二乘法算法计算所述表格图像在竖直方向的倾斜角度θ
竖直
,其中,m代表横线数量,n代表竖线数量,m和n均为正整数;根据倾斜角度θ
水平
和倾斜角度θ
竖直
矫正所述表格图像。7.根据权利要求6所述的处理方法,其特征在于,计算每条横线与所述水平辅助线的倾斜角度α
m
、计算每条竖线与所述竖直辅助线的倾斜角度β
n
,包括:随意获取每条横线上的两个坐标值(x
横线1
,y
横线1
),(x
横线2
,y
横线2
);根据两个横线坐标值得到倾斜角度α
m
;以及随意获取每条竖线上的两个坐标值(x
竖线1
,y
竖线1
),(x
竖线2
,y
竖线2
);根据两个竖线坐标值得到倾斜角度β
n
。8.根据权利要求7所述的处理方法,其特征在于,所述倾斜角度α
m
和所述倾斜角度β
n
通过第一公式计算获得,
其中,所述第一公式为:其中,...
【专利技术属性】
技术研发人员:胡翔,郑邦东,熊博颖,程林鹏,李虎,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。