一种基于深度学习的表格检测方法及系统技术方案

技术编号:39504841 阅读:9 留言:0更新日期:2023-11-24 11:36
本发明专利技术提供了表格检测技术领域的一种基于深度学习的表格检测方法及系统,方法包括如下步骤:步骤

【技术实现步骤摘要】
一种基于深度学习的表格检测方法及系统


[0001]本专利技术涉及表格检测
,特别指一种基于深度学习的表格检测方法及系统


技术介绍

[0002]随着票据

名单等带有表单

表格的文件被广泛应用,将纸质文件转化成电子数据并保存管理,成为了很多企业的必然工作

然而,传统人工录入的方式效率低

差错多

流程长,已无法满足当下的需求,如果能将表格图片进行自动化的结构化展现,可以很大程度降低成本,提高效率以及使用体验

[0003]随着扫描技术的普及,通过手机就能将图片转化为可编辑的文档等;但是现在的扫描技术在处理带有表格类型的文字时,往往没有那么灵敏,经常把完整表格拆分成难以使用的零散个体,后续还需人工进行相应的调整处理,非常繁琐,用户体验不佳

[0004]因此,如何提供一种基于深度学习的表格检测方法及系统,实现提升表格检测的准确度以及质量,成为一个亟待解决的技术问题


技术实现思路

[0005]本专利技术要解决的技术问题,在于提供一种基于深度学习的表格检测方法及系统,实现提升表格检测的准确度以及质量

[0006]第一方面,本专利技术提供了一种基于深度学习的表格检测方法,包括如下步骤:
[0007]步骤
S10、
获取表格图片,对所述表格图片进行包括边界框

关键点以及方向的表格参数的检测,得到表格区域图片;
[0008]步骤
S20、
对所述表格区域图片进行矫正;
[0009]步骤
S30、
对矫正后的所述表格区域图片中的表格进行检测,得到检测结果;
[0010]步骤
S40、
基于所述检测结果进行单元格过滤

表格过滤以及行列过滤的过滤操作,进而得到表格数据;
[0011]步骤
S50、
识别所述表格图片中的文字,基于所述文字以及表格数据生成表格文件,以完成所述表格图片的表格检测

[0012]进一步的,所述步骤
S10
具体包括:
[0013]步骤
S11、
获取待检测的表格图片,通过目标检测算法检测所述表格图片中的边框,选取置信度最高的所述边框作为表格的边界框;
[0014]步骤
S12、
基于所述边界框对表格图片进行裁剪得到表格区域图片,通过语义分割算法对所述表格区域图片进行语义分割后,通过
opencv
边缘轮廓处理算法识别分割后的所述表格区域图片内的关键点,基于各所述关键点绘制表格边界;
[0015]步骤
S13、
基于所述表格边界以及
LCNet
算法检测所述表格区域图片中表格的方向

[0016]进一步的,所述步骤
S20
具体为:
[0017]通过
opencv
对所述表格区域图片进行透视变换,进而对所述表格区域图片进行矫正

[0018]进一步的,所述步骤
S30
具体为:
[0019]通过目标检测算法,对矫正后的所述表格区域图片中的表格的表格行

表格列以及单元格类型进行检测,得到检测结果;
[0020]所述单元格类型为单一单元格

跨行合并单元格或者跨列合并单元格;所述检测结果携带各单元格的宽度和高度

[0021]进一步的,所述步骤
S40
中,所述单元格过滤具体为:基于跨行合并单元格的高度大于所在行的高度,跨列合并单元格的宽度大于所在列的宽度的先验信息进行单元格过滤;
[0022]所述表格过滤具体为:基于一张表格图片只有一个表格的先验信息进行表格过滤;
[0023]所述行列过滤具体为:基于表格行列的宽度和高度的相关性的先验信息进行行列过滤

[0024]第二方面,本专利技术提供了一种基于深度学习的表格检测系统,包括如下模块:
[0025]表格参数检测模块,用于获取表格图片,对所述表格图片进行包括边界框

关键点以及方向的表格参数的检测,得到表格区域图片;
[0026]图片矫正模块,用于对所述表格区域图片进行矫正;
[0027]表格检测模块,用于对矫正后的所述表格区域图片中的表格进行检测,得到检测结果;
[0028]过滤模块,用于基于所述检测结果进行单元格过滤

表格过滤以及行列过滤的过滤操作,进而得到表格数据;
[0029]表格文件生成模块,用于识别所述表格图片中的文字,基于所述文字以及表格数据生成表格文件,以完成所述表格图片的表格检测

[0030]进一步的,所述表格参数检测模块具体包括:
[0031]边界框检测单元,用于获取待检测的表格图片,通过目标检测算法检测所述表格图片中的边框,选取置信度最高的所述边框作为表格的边界框;
[0032]关键点检测单元,用于基于所述边界框对表格图片进行裁剪得到表格区域图片,通过语义分割算法对所述表格区域图片进行语义分割后,通过
opencv
边缘轮廓处理算法识别分割后的所述表格区域图片内的关键点,基于各所述关键点绘制表格边界;
[0033]方向检测单元,用于基于所述表格边界以及
LCNet
算法检测所述表格区域图片中表格的方向

[0034]进一步的,所述图片矫正模块具体用于:
[0035]通过
opencv
对所述表格区域图片进行透视变换,进而对所述表格区域图片进行矫正

[0036]进一步的,所述表格检测模块具体用于:
[0037]通过目标检测算法,对矫正后的所述表格区域图片中的表格的表格行

表格列以及单元格类型进行检测,得到检测结果;
[0038]所述单元格类型为单一单元格

跨行合并单元格或者跨列合并单元格;所述检测
结果携带各单元格的宽度和高度

[0039]进一步的,所述过滤模块中,所述单元格过滤具体为:基于跨行合并单元格的高度大于所在行的高度,跨列合并单元格的宽度大于所在列的宽度的先验信息进行单元格过滤;
[0040]所述表格过滤具体为:基于一张表格图片只有一个表格的先验信息进行表格过滤;
[0041]所述行列过滤具体为:基于表格行列的宽度和高度的相关性的先验信息进行行列过滤

[0042]本专利技术的优点在于:
[0043]通过对获取的表格图片进行包括边界框

关键点以及方向的表格参数的检测,得到表格区域图片,再通过
opencv
对表格区域图片本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于深度学习的表格检测方法,其特征在于:包括如下步骤:步骤
S10、
获取表格图片,对所述表格图片进行包括边界框

关键点以及方向的表格参数的检测,得到表格区域图片;步骤
S20、
对所述表格区域图片进行矫正;步骤
S30、
对矫正后的所述表格区域图片中的表格进行检测,得到检测结果;步骤
S40、
基于所述检测结果进行单元格过滤

表格过滤以及行列过滤的过滤操作,进而得到表格数据;步骤
S50、
识别所述表格图片中的文字,基于所述文字以及表格数据生成表格文件,以完成所述表格图片的表格检测
。2.
如权利要求1所述的一种基于深度学习的表格检测方法,其特征在于:所述步骤
S10
具体包括:步骤
S11、
获取待检测的表格图片,通过目标检测算法检测所述表格图片中的边框,选取置信度最高的所述边框作为表格的边界框;步骤
S12、
基于所述边界框对表格图片进行裁剪得到表格区域图片,通过语义分割算法对所述表格区域图片进行语义分割后,通过
opencv
边缘轮廓处理算法识别分割后的所述表格区域图片内的关键点,基于各所述关键点绘制表格边界;步骤
S13、
基于所述表格边界以及
LCNet
算法检测所述表格区域图片中表格的方向
。3.
如权利要求1所述的一种基于深度学习的表格检测方法,其特征在于:所述步骤
S20
具体为:通过
opencv
对所述表格区域图片进行透视变换,进而对所述表格区域图片进行矫正
。4.
如权利要求1所述的一种基于深度学习的表格检测方法,其特征在于:所述步骤
S30
具体为:通过目标检测算法,对矫正后的所述表格区域图片中的表格的表格行

表格列以及单元格类型进行检测,得到检测结果;所述单元格类型为单一单元格

跨行合并单元格或者跨列合并单元格;所述检测结果携带各单元格的宽度和高度
。5.
如权利要求1所述的一种基于深度学习的表格检测方法,其特征在于:所述步骤
S40
中,所述单元格过滤具体为:基于跨行合并单元格的高度大于所在行的高度,跨列合并单元格的宽度大于所在列的宽度的先验信息进行单元格过滤;所述表格过滤具体为:基于一张表格图片只有一...

【专利技术属性】
技术研发人员:黄家昌赵宝华杨辉
申请(专利权)人:福建亿能达信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1