基于人工智能的表格检测方法、装置、电子设备及介质制造方法及图纸

技术编号:31917311 阅读:15 留言:0更新日期:2022-01-15 12:59
本发明专利技术涉及人工智能技术领域,提供一种基于人工智能的表格检测方法、装置、电子设备及介质,所述方法包括:响应于对表格图片中的表格进行检测的指令,调用预先训练的表格区域检测模型检测所述表格图片中的表格区域;提取所述表格区域中的文本行,并确定所述文本行的位置向量;根据所述文本行的文本特征向量及所述文本行的位置向量生成目标网络结构图;输入所述目标网络结构图至预先训练的图卷积神经网络中,并获取所述图卷积神经网络输出的任意两个文本行的文本实体标签;根据所述文本实体标签确定所述表格区域中的单元格。本发明专利技术能够高效地从表格图片中检测到表格,表格的检测准确度较高。度较高。度较高。

【技术实现步骤摘要】
基于人工智能的表格检测方法、装置、电子设备及介质


[0001]本专利技术涉及人工智能
,具体涉及一种基于人工智能的表格检测方法、装置、电子设备及介质。

技术介绍

[0002]表格是各类文档中常见的页面对象,要正确提取出表格中的数据,首先要进行表格检测。表格检测任务是从一个图片中检测出表格所在的区域,而表格结构识别是在拿到一个表格后,将表格的内容与逻辑结构识别出来。
[0003]目前基于布局分析和规则的方法及基于深度学习的方法较为流行,然而专利技术人在实现本专利技术的过程中发现,由于表格大小、种类与样式复杂多样,比如不同表格中的行列合并方法、背景填充以及文本类型等均不相似,使用基于布局分析和规则的方法通过分析文档中表格的布局特征,然后使用这些特征来制定一些规则进而提取表格中的内容,过程非常繁杂而且泛化性能较差。而基于深度学习的方法需要大量的标注数据对模型进行训练,而文档中的表格通常存在缺少规则以及行、列等未知信息,因此识别准确度较低。

技术实现思路

[0004]鉴于以上内容,有必要提出一种基于人工智能的表格检测方法、装置、电子设备及介质,能够高效地从表格图片中检测到表格并识别出表格中的内容。
[0005]本专利技术的第一方面提供一种基于人工智能的表格检测方法,所述方法包括:
[0006]响应于对表格图片中的表格进行检测的指令,调用预先训练的表格区域检测模型检测所述表格图片中的表格区域;
[0007]提取所述表格区域中的文本行,并确定所述文本行的位置向量;
[0008]根据所述文本行的文本特征向量及所述文本行的位置向量生成目标网络结构图;
[0009]输入所述目标网络结构图至预先训练的图卷积神经网络中,并获取所述图卷积神经网络输出的任意两个文本行的文本实体标签;
[0010]根据所述文本实体标签确定所述表格区域中的单元格。
[0011]根据本专利技术的一个可选的实施方式,所述表格区域检测模型的训练过程包括:
[0012]初始化随机数集合,所述随机数集合中的每个随机数小于预设阈值;
[0013]将所述随机数集合中的随机数分配给卷积神经网络的卷积层,得到初始表格区域检测模型;
[0014]获取样本表格图片,并获取所述样本表格图片对应的标注表格信息;
[0015]将所述样本表格图片及对应的所述标注表格信息分别作为所述初始表格区域检测模型的输入和期望输出,对所述初始表格区域检测模型进行训练,得到所述表格区域检测模型。
[0016]根据本专利技术的一个可选的实施方式,所述获取样本表格图片,并获取所述样本表格图片对应的标注表格信息包括:
[0017]确定所述样本表格的表格区域以及所述样本表格的单元格信息和文本信息;
[0018]根据所述表格区域、所述单元格信息和所述文本信息,生成表格图片;
[0019]将所述表格图片确定为所述样本表格图片,并将所述单元格信息确定为标注表格信息。
[0020]根据本专利技术的一个可选的实施方式,所述确定所述文本行的位置向量包括:
[0021]获取所述文本行对应的文本框的顶点坐标;
[0022]根据所述顶点坐标计算得到中心坐标;
[0023]根据所述顶点坐标计算得到所述文本行的宽度及高度;
[0024]基于所述顶点坐标、所述中心坐标、所述宽度及所述高度生成所述文本行的位置向量。
[0025]根据本专利技术的一个可选的实施方式,所述根据所述文本行的文本特征向量及所述文本行的位置向量生成目标网络结构图包括:
[0026]将每个文本行看作一个顶点,对于任意一个顶点,计算其他顶点的顶点坐标与所述顶点的顶点坐标之间的空间距离;
[0027]将所述空间距离最近的若干个其他顶点与所述顶点之间各构建一条无向边,得到所述目标网络结构图。
[0028]根据本专利技术的一个可选的实施方式,所述根据所述文本实体标签确定所述表格区域中的单元格包括:
[0029]获取所述文本实体标签中行概率大于预设行概率阈值的目标行概率;
[0030]获取所述文本实体标签中列概率大于预设列概率阈值的目标列概率;
[0031]获取所述目标行概率及所述目标列概率对应的目标文本行;
[0032]将所述目标文本行所在的区域确认为一个单元格。
[0033]根据本专利技术的一个可选的实施方式,所述方法还包括:
[0034]使用可变性卷积神经网络识别所述单元格中的内容;及/或
[0035]基于所述文本实体标签中任意两个文本行处于同一行的行概率和处于同一列的列概率,对所述文本行进行结构化重组以将所述表格区域重建为结构化表格。
[0036]本专利技术的第二方面提供一种基于人工智能的表格检测装置,所述装置包括:
[0037]检测模块,用于响应于对表格图片中的表格进行检测的指令,调用预先训练的表格区域检测模型检测所述表格图片中的表格区域;
[0038]提取模块,用于提取所述表格区域中的文本行,并确定所述文本行的位置向量;
[0039]生成模块,用于根据所述文本行的文本特征向量及所述文本行的位置向量生成目标网络结构图;
[0040]获取模块,用于输入所述目标网络结构图至预先训练的图卷积神经网络中,并获取所述图卷积神经网络输出的任意两个文本行的文本实体标签;
[0041]确定模块,用于根据所述文本实体标签确定所述表格区域中的单元格。
[0042]本专利技术的第三方面提供一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述基于人工智能的表格检测方法。
[0043]本专利技术的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人工智能的表格检测方
法。
[0044]综上所述,本专利技术所述的基于人工智能的表格检测方法、装置、电子设备及介质,响应于对表格图片中的表格进行检测的指令,调用预先训练的表格区域检测模型检测所述表格图片中的表格区域,并提取所述表格区域中的文本行,在确定所述文本行的位置向量后,根据所述文本行的文本特征向量及所述文本行的位置向量生成目标网络结构图,从而输入所述目标网络结构图至预先训练的图卷积神经网络中,并获取所述图卷积神经网络输出的任意两个文本行的文本实体标签,根据所述文本实体标签确定所述表格区域中的单元格。本专利技术基于图卷积神经网络(GCN)来对文本图片中表格的结构化布局进行检测,与传统的直接检测表格位置不同,本专利技术通过融合文本特征向量和位置向量来识别表格位置,能够对表格进行精确的边缘预测,取得了较好的效果,是一种纯粹的结构感知方法,不需要依赖语言和文本识别的质量。
附图说明
[0045]图1是本专利技术实施例一提供的基于人工智能的表格检测方法的流程图。
[0046]图2是本专利技术实施例二提供的基于人工智能的表格检测装置的结构图。
[0047]图3是本专利技术实施例三本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的表格检测方法,其特征在于,所述方法包括:响应于对表格图片中的表格进行检测的指令,调用预先训练的表格区域检测模型检测所述表格图片中的表格区域;提取所述表格区域中的文本行,并确定所述文本行的位置向量;根据所述文本行的文本特征向量及所述文本行的位置向量生成目标网络结构图;输入所述目标网络结构图至预先训练的图卷积神经网络中,并获取所述图卷积神经网络输出的任意两个文本行的文本实体标签;根据所述文本实体标签确定所述表格区域中的单元格。2.如权利要求1所述的基于人工智能的表格检测方法,其特征在于,所述表格区域检测模型的训练过程包括:初始化随机数集合,所述随机数集合中的每个随机数小于预设阈值;将所述随机数集合中的随机数分配给卷积神经网络的卷积层,得到初始表格区域检测模型;获取样本表格图片,并获取所述样本表格图片对应的标注表格信息;将所述样本表格图片及对应的所述标注表格信息分别作为所述初始表格区域检测模型的输入和期望输出,对所述初始表格区域检测模型进行训练,得到所述表格区域检测模型。3.如权利要求2所述的基于人工智能的表格检测方法,其特征在于,所述获取样本表格图片,并获取所述样本表格图片对应的标注表格信息包括:确定所述样本表格的表格区域以及所述样本表格的单元格信息和文本信息;根据所述表格区域、所述单元格信息和所述文本信息,生成表格图片;将所述表格图片确定为所述样本表格图片,并将所述单元格信息确定为标注表格信息。4.如权利要求1所述的基于人工智能的表格检测方法,其特征在于,所述确定所述文本行的位置向量包括:获取所述文本行对应的文本框的顶点坐标;根据所述顶点坐标计算得到中心坐标;根据所述顶点坐标计算得到所述文本行的宽度及高度;基于所述顶点坐标、所述中心坐标、所述宽度及所述高度生成所述文本行的位置向量。5.如权利要求4所述的基于人工智能的表格检测方法,其特征在于,所述根据所述文本行的文本特征向量及所述文本行的位置向量生成目标网络结构图包括:将每个文本行看作...

【专利技术属性】
技术研发人员:雷田子
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1