一种表格识别套打方法、计算机设备及计算机可读存储介质技术

技术编号：26971282 阅读：34 留言：0更新日期：2021-01-06 00:02

本发明专利技术涉及一种表格识别套打方法、计算机设备及计算机可读存储介质，包括步骤：获取待识别的表格图像，并对采集到的表格图像进行预处理，得到预处理后的第一目标图像；对预处理后的第一目标图像进行校正处理以获得第二目标图像；提取第二目标图像的表格轮廓并进行细化处理获得第三目标图像；根据第三目标图像分析表格横纵结构，获得表格行列结构信息；通过角点检测识别第三目标图像的角点位置，结合表格行列结构信息，确定表格中单元格位置信息；输出表格中单元格位置信息；其能够实现了对表格的识别，并进行套打且剔除表格中的数据信息，实现利用计算机自动对表格进行套打来提高人们的办公效率，达到只需表格图片，即可打印所需表格的目的。

全部详细技术资料下载

【技术实现步骤摘要】
一种表格识别套打方法、计算机设备及计算机可读存储介质
本专利技术涉及表格套打
，特别是涉及一种表格识别套打方法、计算机设备及计算机可读存储介质。
技术介绍
现代社会中，很多行业对各种表单、票据等有着十分严格的规范、限定条件，其格式是无法擅自更改的，一旦更改则会失效，所以通常情况下，需要先人工对各种表格进行设计，再进行使用，这种做法不仅效率低，而且耗时，人工成本较大。现有技术中也存在对于表格图像识别的方法，比如使用表格线交叉点分析方法提取表格线的方法过于耗时且稳定性较差，如中国专利技术专利申请说明书CN109948135A公开的一种基于表格特征归一化图像的方法及设备，其采用表格线交叉点分析法进行表格识别，从所述待识别图和模板图中选取至少一个位置相对应的单元格，并分别从选取的单元格中至少确认四个位于外边框上的顶点，所述待识别图中确认的顶点与所述模板图中确认的顶点位置相对应，形成至少四组相对应的顶点坐标等等，识别过程较为复杂且稳定性较差。因而，亟需专利技术一种表格识别套打方法、计算机设备及计算机可读存储介质，其能够实现了对表...

【技术保护点】
1.一种表格识别套打方法，其特征在于，包括：/n获取待识别的表格图像，并对采集到的表格图像进行预处理，得到预处理后的第一目标图像；/n对预处理后的第一目标图像进行校正处理以获得第二目标图像；/n提取第二目标图像的表格轮廓并进行细化处理获得第三目标图像；/n根据第三目标图像分析表格横纵结构，以获得表格行列结构信息；/n通过角点检测识别第三目标图像的角点位置，并结合表格行列结构信息，确定表格中单元格位置信息；/n输出表格中单元格位置信息，以绘制表格实现表格套打。/n

【技术特征摘要】
1.一种表格识别套打方法，其特征在于，包括：
获取待识别的表格图像，并对采集到的表格图像进行预处理，得到预处理后的第一目标图像；
对预处理后的第一目标图像进行校正处理以获得第二目标图像；
提取第二目标图像的表格轮廓并进行细化处理获得第三目标图像；
根据第三目标图像分析表格横纵结构，以获得表格行列结构信息；
通过角点检测识别第三目标图像的角点位置，并结合表格行列结构信息，确定表格中单元格位置信息；
输出表格中单元格位置信息，以绘制表格实现表格套打。

2.根据权利要求1所述的一种表格识别套打方法，其特征在于，对预处理后的第一目标图像进行校正处理以获得第二目标图像之前，还包括检测第一目标图像的表格图像是否采集完整，具体如下：
检测第一目标的表格图像的外轮廓边界是否接触到图像的边缘；
检测第一目标的表格图像的外轮廓的轮廓端点数是否等于4个；
若判定表格外轮廓接触到图像边界或表格外轮廓端点数不是4个，则判断为表格拍摄不完整，返回重拍。

3.根据权利要求1所述的一种表格识别套打方法，其特征在于，对预处理后的第一目标图像进行校正处理以获得第二目标图像，步骤包括：识别第一目标图像所有边框，进行凸包拟合，筛选出最大的边框为A4纸的边框，得到A4纸的顶点坐标信息，通过透视变换矩阵进行透视变换校正，以获得第二目标图像；其中，识别第一目标图像所有边框的步骤包括：寻找第一目标图像中的物体轮廓，再查找出图像中物体的凸包，将检测出来的轮廓连续光滑的曲线折线化，并对图像轮廓点进行多边形拟合，筛选出所有的四边形边框。

4.根据权利要求3所述的一种表格识别套打方法，其特征在于，通过透视变换矩阵进行透视变换校正，包括：变换公式为

其中，u、v是原始图片坐标，通过该变换公式，可以得到变换后对应的图片坐标变换矩阵可拆分为几部分：表示线性变换，包含缩放、旋转、错切等；[a31a32]代表平移；[a13a23]T产生透视变换；可得

从而将定位得到的A4纸的四个顶点坐标、结合原始坐标代入变换公式中，以实现透视校正。

5.根据权利要求1所述的一种表格识别套打方法，其特征在于，对采集到的表格图像进行预处理，步骤包括：
灰度化处理，将采集到的表格图像转变为单通道的灰度图像；
二值化处理，对灰度化处理后的灰度图像使用局部自适应阈值法以动态形式确定二值化阈值，实现表格图像的二值化处理；
高斯滤波处理，使用图像滤波减小图片噪声的干扰，使用高斯滤波降噪，使用掩膜扫描图像，利用掩膜中心像素领域的像素加权平均代替掩膜中心像素的像素值，遍历整张表格图像实现高斯滤波处理；
边...

【专利技术属性】
技术研发人员：张志，李建军，黄涛，詹皇源，杜启亮，杨湖广，
申请(专利权)人：国信智能系统广东有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人