【技术实现步骤摘要】
表格重建方法和装置、计算机可读存储介质和电子设备
[0001]本申请涉及图像处理
,具体涉及一种表格重建方法和表格重建装置,以及计算机可读存储介质和电子设备。
技术介绍
[0002]现有表格重建方法的原理一般是:首先,识别出表格的所有交点,然后,对所有交点进行连线,从而重建表格。然而,很多表格都有合并单元格,一个合并单元格的线框上可能有6个交点,如果直接对6个交点进行连接,会将原本的1个合并单元格重建为2个单元格,导致表格重建的准确率低。
技术实现思路
[0003]有鉴于此,本申请实施例提供了一种表格重建方法和表格重建装置,以及计算机可读存储介质和电子设备,解决了表格重建准确率低的问题。
[0004]第一方面,本申请一实施例提供的一种表格重建方法,包括:基于待识别表格图像,确定待识别表格图像包含的M个表格交点各自的交点坐标和交点类型,其中,表格交点由至少两条线段相交形成,表格交点的交点类型根据表格交点所连接的线段的数量和方向确定;基于M个表格交点各自的交点坐标和交点类型,生成待识别表格图像对应的重建表格。
[0005]结合本申请的第一方面,在一些实施例中,基于待识别表格图像,确定待识别表格图像包含的M个表格交点各自的交点坐标和交点类型,包括:利用表格识别模型,基于待识别表格图像,确定待识别表格图像包含的M个表格交点各自的交点坐标和交点类型。
[0006]结合本申请的第一方面,在一些实施例中,交点类型包括:左上角点、左下角点、右上角点和右下角点;基于M个表格交点各自的交点坐 ...
【技术保护点】
【技术特征摘要】
1.一种表格重建方法,其特征在于,包括:基于待识别表格图像,确定所述待识别表格图像包含的M个表格交点各自的交点坐标和交点类型,其中,所述表格交点由至少两条线段相交形成,所述表格交点的交点类型根据所述表格交点所连接的线段的数量和方向确定;基于所述M个表格交点各自的交点坐标和交点类型,生成所述待识别表格图像对应的重建表格。2.根据权利要求1所述的表格重建方法,其特征在于,所述基于待识别表格图像,确定所述待识别表格图像包含的M个表格交点各自的交点坐标和交点类型,包括:利用表格识别模型,基于所述待识别表格图像,确定所述待识别表格图像包含的M个表格交点各自的交点坐标和交点类型。3.根据权利要求1或2所述的表格重建方法,其特征在于,所述交点类型包括:左上角点、左下角点、右上角点和右下角点;所述基于所述M个表格交点各自的交点坐标和交点类型,生成所述待识别表格图像对应的重建表格,包括:基于所述M个表格交点各自的交点类型,确定交点类型为所述左上角点的P个表格交点;基于所述P个表格交点各自的交点坐标,进行二维排序,得到二维排序结果;基于所述二维排序结果、所述M个表格交点各自的交点坐标和交点类型,依次确定所述P个表格交点各自对应的单元格坐标;基于所述P个表格交点各自对应的单元格坐标,生成所述重建表格。4.根据权利要求3所述的表格重建方法,其特征在于,所述基于所述二维排序结果,依次确定所述P个表格交点各自对应的单元格坐标,包括:针对所述P个表格交点中的每个当前表格交点,基于所述当前表格交点的交点坐标和预设列宽阈值条件,在交点类型为右上角点的表格交点中进行检索;基于所述当前表格交点的交点坐标和预设行高阈值条件,在交点类型为左下角点的表格交点中进行检索;如果检索到符合所述预设列宽阈值条件的表格交点,且检索到符合所述预设行高阈值条件的表格交点,则基于所述当前表格交点的交点坐标、所述当前表格交点对应的符合所述预设列宽阈值条件的表格交点的交点坐标和符合所述预设行高阈值条件的表格交点的交点坐标,确定所述当前表格交点对应的单元格坐标。5.根据权利要求4所述的表格重建方法,其特征在于,所述基于所述二维排序结果,依次确定所述P个表格交点各自对应的单元格坐标,还包括:如果检索到符合所述预设列宽阈值条件的表格交点,未检索到符合所述预设行高阈值条件的表格交点,则基于符合所述预设列宽阈值条件的表格交点和所述预设行高阈值条件,在交点类型为右下角点的表格交点中进行检索;如果在所述交点类型为右下角点的表格交点中检索到符合所述预设行高阈值条件的表格交点,则基于所述当前表格交点的交点坐标、所述当前表格交点对应的符合所述预设列宽阈值条件的表格交点的交点坐标、符合所述预设列宽阈值条件的表格交点对应的符合所述预设行高阈值条件的表格交点的交点坐标,确定所述当前表格交点对应的单元格坐
标。6.根据权利要求4所述的表格重建方法,其特征在于,所述基于所述二维排序结果,依次确定所述P个表格交点各自对应的单元格坐标,还包括:如果未检索到符合所述预设列宽阈值条件的表格交点,检索到符合所述预设行高阈值条件的表格交点,则基于符合所述预设行高阈值条件的表格交点和所述预设行高阈值条件,在交点类型为右下角点的表格交点中进行检索;如果在所述交点类型为右下角点的表格交点中检索到符合所述预设列宽阈...
【专利技术属性】
技术研发人员:王逸馨,孟冬伟,卞负,王为磊,屠昶旸,张济徽,
申请(专利权)人:智慧芽信息科技苏州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。