表格识别方法、装置、非易失性存储介质和计算机设备制造方法及图纸

技术编号:37484072 阅读:13 留言:0更新日期:2023-05-07 09:23
本发明专利技术公开了一种表格识别方法、装置、非易失性存储介质和计算机设备。其中,该方法包括:获取表格图片,其中,表格图片中包括目标表格;识别表格图片中的目标表格,得到目标表格内的文本信息和表征目标表格的单元格结构关系的树状结构信息;基于文本信息和树状结构信息,存储目标表格。本发明专利技术解决了现有技术中对图片中表格识别准确率低的技术问题。图片中表格识别准确率低的技术问题。图片中表格识别准确率低的技术问题。

【技术实现步骤摘要】
表格识别方法、装置、非易失性存储介质和计算机设备


[0001]本专利技术涉及图像识别领域,具体而言,涉及一种表格识别方法、装置、非易失性存储介质和计算机设备。

技术介绍

[0002]表格是一种组织整理数据的重要手段,人们在通讯交流、科学研究以及数据分析活动当中广泛采用各种表格。在论文文献和专利申请文件中存在大量的表格,并且论文文献和专利申请文件均为图片格式,导致文件中的表格以图片形式存在,并且表格中往往包括很多信息。准确的识别表格,在某些业务场景中非常重要。
[0003]相关技术中通常采用文本识别和文本聚类结合的方式识别表格,这种根据文本位置进行文本聚类识别表格结构的方法无法准确识别表格中单元格之间的结构,导致对图片中的表格进行识别时出现较大差错。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种表格识别方法、装置、非易失性存储介质和计算机设备,以至少解决现有技术中对图片中表格识别准确率低的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种表格识别方法,包括:获取表格图片,其中,表格图片中包括目标表格;识别表格图片中的目标表格,得到目标表格内的文本信息和表征目标表格的单元格结构关系的树状结构信息;基于文本信息和树状结构信息,存储目标表格。
[0007]可选地,识别表格图片中的目标表格,得到表征目标表格的单元格结构关系的树状结构信息,包括:根据表格图片,确定目标表格中的表头单元格和表值单元格;根据表头单元格和表值单元格,生成用于表征目标表格的单元格结构关系的树状结构信息。
[0008]可选地,根据表头单元格和表值单元格,生成表征目标表格的单元格结构关系的树状结构信息,包括:在目标表格包括多个表头单元格的情况下,确定多个表头单元格之间的第一父子节点关系;根据第一父子节点关系,确定多个表头单元格中的末级单元格;确定末级单元格与表值单元格之间的第二父子节点关系;根据第一父子节点关系和第二父子节点关系,生成树状结构信息。
[0009]可选地,确定多个表头单元格之间的第一父子节点关系,包括:根据表格图片,确定表头单元格的尺寸、位置和文本至少之一;根据表头单元格的尺寸、位置和文本至少之一,判断表头单元格中任意两个单元格之间的父子节点关系,确定第一父子节点关系。
[0010]可选地,根据表格图片,确定目标表格中的表头单元格和表值单元格,包括:将表格图片输入预先训练的神经网络模型中,神经网络模型输出表格图片中包括的表头单元格和表值单元格,其中,神经网络模型通过标注单元格属性的表格图片样本训练得到。
[0011]可选地,神经网络模型为通过如下方式训练得到的模型:获取多个表格图片样本;
在多个表格图片样本中分别标注表格图片包括的表格中的表头单元格和表值单元格;基于多个表格图片样本训练原始神经网络模型,得到神经网络模型,其中,原始神经网络模型为神经网络模型的原始模型。
[0012]可选地,还包括:根据树状结构信息,建立表格文档,其中,表格文档的结构与树状结构信息的结构匹配;将文本信息填入表格文档,生成对目标表格的识别结果。
[0013]根据本专利技术实施例的另一方面,还提供了一种表格识别装置,包括:获取模块,用于获取表格图片,其中,表格图片中包括目标表格;识别模块,用于识别表格图片中的目标表格,得到目标表格内的文本信息和表征目标表格的单元格结构关系的树状结构信息;存储模块,用于基于文本信息和树状结构信息,存储目标表格。
[0014]根据本专利技术实施例的又一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行上述中任意一项表格识别方法。
[0015]根据本专利技术实施例的再一方面,还提供了一种计算机设备,计算机设备包括处理器,处理器用于运行程序,其中,程序运行时执行上述中任意一项表格识别方法。
[0016]在本专利技术实施例中,采用识别表格图片中目标表格单元格结构关系的方式,通过识别表征目标表格中单元格结构关系的树状结构信息和目标表格内的文本信息,并根据树状结构信息和文本信息存储目标表格,实现了准确识别目标表格结构的目的,从而实现了提高识别表格准确率的技术效果,进而解决了现有技术中对图片中表格识别准确率低的技术问题。
附图说明
[0017]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0018]图1示出了一种用于实现表格识别方法的计算机终端的硬件结构框图;
[0019]图2是根据本专利技术实施例提供的表格识别方法的流程示意图;
[0020]图3是根据本专利技术可选实施例提供的表格图片的示意图;
[0021]图4是根据本专利技术实施例提供的表格识别装置的结构框图。
具体实施方式
[0022]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0023]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于
清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0024]首先,对本申请实施例进行描述的过程中出现的部分名词或者术语适用于如下解释:
[0025]文字识别(Optical Character Recognition,简称OCR),即电子设备检查纸上打印的字符或图片中的字符并将其翻译成计算机文字的过程。
[0026]根据本专利技术实施例,提供了一种表格识别的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0027]本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现表格识别方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中采用102a、102b,
……
,102n来示出)处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格识别方法,其特征在于,包括:获取表格图片,其中,所述表格图片中包括目标表格;识别所述表格图片中的所述目标表格,得到所述目标表格内的文本信息和表征所述目标表格的单元格结构关系的树状结构信息;基于所述文本信息和所述树状结构信息,存储所述目标表格。2.根据权利要求1所述的方法,其特征在于,所述识别所述表格图片中的所述目标表格,得到表征所述目标表格的单元格结构关系的树状结构信息,包括:根据所述表格图片,确定所述目标表格中的表头单元格和表值单元格;根据所述表头单元格和所述表值单元格,生成用于表征所述目标表格的单元格结构关系的树状结构信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述表头单元格和所述表值单元格,生成表征所述目标表格的单元格结构关系的树状结构信息,包括:在所述目标表格包括多个表头单元格的情况下,确定所述多个表头单元格之间的第一父子节点关系;根据所述第一父子节点关系,确定所述多个表头单元格中的末级单元格;确定所述末级单元格与所述表值单元格之间的第二父子节点关系;根据所述第一父子节点关系和第二父子节点关系,生成所述树状结构信息。4.根据权利要求3所述的方法,其特征在于,所述确定所述多个表头单元格之间的第一父子节点关系,包括:根据所述表格图片,确定所述表头单元格的尺寸、位置和文本至少之一;根据所述表头单元格的尺寸、位置和文本至少之一,判断所述表头单元格中任意两个单元格之间的父子节点关系,确定所述第一父子节点关系。5.根据权利要求2所述的方法,其特征在于,所述根据所述表格图片,确定所述目标表格中的表头单元格和表值单元格,包括:将所述表格图片输入预先训练的...

【专利技术属性】
技术研发人员:于翠楠
申请(专利权)人:南京燧坤智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1