【技术实现步骤摘要】
一种表格识别方法及其系统
本专利技术涉及OCR图片识别
,具体而言,涉及一种表格识别方法及其系统。
技术介绍
在OCR(光学字符识别系统)中,表格的识别,可以为文档中关键字段的抽取提供重要信息,也可以用于还原可编辑表格以节省人工录入。传统的表格识别方法一般都是基于直线检测的方法,即首先对文档图片倾角矫正、二值化、腐蚀膨胀等预处理方法,然后再检测表格直线,进而求出表格线的交点,从而还原整个表格结构。上述方法在预处理阶段需要人为设定图像预处理参数,且要求表格线清晰且连续。如果表格中的单元格上的表格线没有闭合,那么就无法检测表格线。我们将有部分表格线的表格定义为开放式表格,开放式表格广范存在于各类文档中。针对这一类表格,传统表格识别方法,无法准确还原整体的表格结构,且对表格的清晰度要求也比较高。有鉴于此,特提出本专利技术。
技术实现思路
有鉴于此,本专利技术公开了一种表格识别方法,以及用于实现上述表格识别方法的识别系统,以实现对表格图像准确的识别还原。具体地,本专利技术是通过以下技
【技术保护点】
1.一种表格的识别方法,其特征在于,包括如下步骤:/n获取初始表格图像,并对所述初始表格图像进行水平校正以生成预处理表格图像;/n采用基于深度学习的物体检测方法对所述预处理表格图像的角点坐标进行检测,并对表格区域的文字进行识别;/n基于图神经网络的方法判断预处理表格图像中单元格之间的位置关系,并对所述预处理表格图像中所包含的单元格以及文字进行结构还原。/n
【技术特征摘要】
1.一种表格的识别方法,其特征在于,包括如下步骤:
获取初始表格图像,并对所述初始表格图像进行水平校正以生成预处理表格图像;
采用基于深度学习的物体检测方法对所述预处理表格图像的角点坐标进行检测,并对表格区域的文字进行识别;
基于图神经网络的方法判断预处理表格图像中单元格之间的位置关系,并对所述预处理表格图像中所包含的单元格以及文字进行结构还原。
2.根据权利要求1所述的识别方法,其特征在于,对所述初始表格图像进行水平校正的方法包括采用Hough直线检测的方法或采用傅里叶变换的方法进行水平校正。
3.根据权利要求1所述的识别方法,其特征在于,对所述预处理表格图像的角点坐标进行检测的方法包括:对所述预处理表格图像中所包含的每个单元格的对角线上的角点坐标进行检测。
4.根据权利要求3所述的识别方法,其特征在于,对表格区域中的文字进行识别的方法包括:
预测文字块的位置信息;
基于所述文字块的位置和每个单元格的位置来判断所述文字块归属的单元格以完成识别。
5.根据权利要求1-4任一项所述的识别方法,其特征在于,判断预处理表格图像中单元...
【专利技术属性】
技术研发人员:陈鸣,刘家俊,刘占亮,
申请(专利权)人:北京一览群智数据科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。