【技术实现步骤摘要】
一种表格识别方法及装置
[0001]本申请涉及图像处理领域,特别是涉及一种表格识别方法及装置。
技术介绍
[0002]表格识别包括表格结构识别(Table Structure Recognition,TSR)和表格内容识别(Table Content Recognition,TCR)两部分。其中:结构识别是指从包括表格的图像中解析出每个单元格所在的行列位置和具体的包围框物理位置。内容识别指的是将每个单元格内的文本识别出来。通过结构识别和内容识别两个步骤,即可得到每个单元格的结构坐标和其中的文本内容,进而可将该表格转换为excel或word等格式,便于进一步人工校对和编辑,大大方便了表格信息的数字化处理流程。
[0003]目前识别表格结构的方法比较复杂,会耗费较多的计算资源。
[0004]因此,急需一种方案,能够解决上述问题。
技术实现思路
[0005]本申请所要解决的技术问题是如何简单的识别出表格结构,提供一种表格识别方法及装置。
[0006]第一方面,本申请实施例提供了一种表格识别方 ...
【技术保护点】
【技术特征摘要】
1.一种表格识别方法,其特征在于,所述方法包括:获取包括表格的待处理图像,并确定所述待处理图像中各个单元格的信息,所述各个单元格的信息,包括所述各个单元格的包围框的位置;根据所述各个单元格的信息,得到所述各个单元格在行方向上的父单元格和所述各个单元格在列方向的父单元格;根据所述各个单元格在行方向上的父子关系和所述各个单元格在列方向上的父子关系,得到所述各个单元格的结构坐标,其中,所述结构坐标包括:起始行、起始列、终止行和终止列。2.根据权利要求1所述的方法,其特征在于,所述各个单元格的信息,还包括:所述各个单元格内的文本的词嵌入向量,和/或,所述各个单元格的视觉特征。3.根据权利要求1或2所述的方法,其特征在于,所述根据所述各个单元格的信息,得到所述各个单元格在行方向上的父单元格和所述各个单元格在列方向的父单元格,包括:将所述各个单元格的信息输入机器学习模型,得到所述各个单元格在行方向上的父单元格和所述各个单元格在列方向的父单元格。4.根据权利要求3所述的方法,其特征在于,所述机器学习模型包括:特征提取模块、第一决策模块和第二决策模块;所述特征提取模块,用于对所述各个单元格的信息进行处理,得到特性序列;所述第一决策模块用于根据所述特征序列,得到所述各个单元格在行方向上的父单元格;所述第二决策模块用于根据所述特征序列,得到所述各个单元格在列方向上的父单元格。5.根据权利要求4所述的方法,其特征在于,所述特征提取模块为Transformer模型的编码器。6.根据权利要求4所述的方法,其特征在于,所述第一决策模块和第二决策模块均为自注意力self
‑
attention模块。7.根据权利要求1所述的方法,其特征在于,所述根据所述各个单元格在行方向上的父子关系和所述各个单元格在列方向上的父子关系,得到所述各个单元格的结构坐标,包括:根据所述各个单元格在行方向上的父子关系,确定所述各个单元格的起始行和终止行;根据所述各个单元格在列方向上的父子关系,确定所述各个单元格的起始列和终止列。8.根据权利要求7所述的方法,其特征在于,至少一棵树结构用于指示所述各个单元格在行方向上的父子关系,一个单元格对应树上的一个节点,所述根据所述各个单元格在行方向上的父子关系,确定所述各个单元格的起始行和终止行,包括:确定单元格i对应的起始行坐标b_i;确定单元格i所跨越的行数r_i;根据所述b_i和所述r_i,确定单元格i对应的终止行坐标为b_i+r_i
‑<...
【专利技术属性】
技术研发人员:张文强,黄灿,
申请(专利权)人:北京有竹居网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。