表格结构识别方法、装置、设备及存储介质制造方法及图纸

技术编号:34142085 阅读:51 留言:0更新日期:2022-07-14 18:04
本发明专利技术提供一种表格结构识别方法、装置、设备及存储介质,属于图像识别技术领域。表格结构识别方法,包括:获取目标图像,目标图像为包括表格结构的图像;将目标图像输入到语义分割模型,输出目标图像中的表格分隔线,表格分隔线包括横分隔线和竖分隔线,语义分割模型具备识别目标图像中的有线表格分隔线和无线表格分隔线的能力;根据表格分隔线确定表格结构的单元格;匹配单元格和表格结构中各单元格的文本,以确定表格结构。以对无线表格和有线表格都能够进行良好的识别。格都能够进行良好的识别。格都能够进行良好的识别。

【技术实现步骤摘要】
表格结构识别方法、装置、设备及存储介质


[0001]本专利技术涉及图像识别
,具体而言,涉及一种表格结构识别方法、装置、设备及存储介质。

技术介绍

[0002]在人们进行无纸化办公的过程中,为了具有更高的传播性,避免其他电脑无法打开或打开后文档排版不一致。电脑中很多文档都是PDF、图片等格式。
[0003]从而,当用户需要将PDF或图片格式的文档中的表格结构复制出来,则需要通过图像识别技术先对文档中的表格结构进行识别。
[0004]当时,目前的表格结构识别方式中,一般采用图像处理的方式来识别图像中的表格分隔线,从而识别出表格结构,但是这种方式对于表格分割线为无线的表格结构(即无线表格),则无法进行识别。

技术实现思路

[0005]本专利技术的目的在于提供一种表格结构识别方法、装置、设备及存储介质,以对无线表格和有线表格都能够进行良好的识别。
[0006]本专利技术的实施例是这样实现的:
[0007]本专利技术实施例的第一方面,提供一种表格结构识别方法,包括:获取目标图像,目标图像为包括表格结构的图像;将目标图像输入到语义分割模型,输出目标图像中的表格分隔线,表格分隔线包括横分隔线和竖分隔线,语义分割模型具备识别目标图像中的有线表格分隔线和无线表格分隔线的能力;根据表格分隔线确定表格结构的单元格;匹配单元格和表格结构中各单元格的文本,以确定表格结构。
[0008]通过该方法,无论表格结构中的表格分隔线为有线还是无线,均能够利用语义分割模型来进行识别,从而便能够根据识别出的表格分隔线来确定出表格结构中的各单元格。进而匹配出表格结构。如此,能够简单有效的对无线表格和有线表格或者部分有线部分无线的表格结构进行识别。
[0009]可选地,根据表格分隔线确定表格结构的单元格,包括:确定各表格分隔线间的交点;按列从左到右、按列从右到左、按行从上到下以及按行从下到上中的至少两个方向遍历交点;若存在四个交点,四个交点中任意相邻的两个交点均处于同一表格分隔线中,则确定四个交点围成一个单元格。
[0010]可选地,获取目标图像,包括:确定待识别图像中的表格结构的位置信息;根据位置信息裁剪待识别图像,以得到目标图像。
[0011]可选地,在获取目标图像之前,方法还包括:识别待识别图像中的文本;根据文本的方向,调整待识别图像以使文本的方向调整为可读方向。
[0012]可选地,语义分割模型采用数据集训练,数据集包括多个包含表格结构的图像,且各图像中对表格结构的表格分隔线进行了标注。
[0013]本专利技术实施例的第二方面,提供一种表格结构识别装置,其特征在于,包括:获取模块,用于获取目标图像,目标图像为包括表格结构的图像;处理模块,用于将目标图像输入到语义分割模型,输出目标图像中的表格分隔线,表格分隔线包括横分隔线和竖分隔线,语义分割模型具备识别目标图像中的有线表格分隔线和无线表格分隔线的能力;根据表格分隔线确定表格结构的单元格;匹配单元格和表格结构中各单元格的文本,以确定表格结构。
[0014]可选地,处理模块,具体用于确定各表格分隔线间的交点;按列从左到右、按列从右到左、按行从上到下以及按行从下到上中的至少两个方向遍历交点;若存在四个交点,四个交点中任意相邻的两个交点均处于同一表格分隔线中,则确定四个交点围成一个单元格。
[0015]可选地,获取模块,具体用于确定待识别图像中的表格结构的位置信息;根据位置信息裁剪待识别图像,以得到目标图像。
[0016]可选地,该装置还包括识别模块,用于识别待识别图像中的文本;根据文本的方向,调整待识别图像以使文本的方向调整为可读方向。
[0017]可选地,语义分割模型采用数据集训练,数据集包括多个包含表格结构的图像,且各图像中对表格结构的表格分隔线进行了标注。
[0018]本专利技术实施例的第三方面,提供一种电子设备,包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行时执行如第一方面任一项的方法的步骤。
[0019]本专利技术实施例的第四方面,提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器运行时执行如第一方面任一项的方法的步骤。
[0020]以上第二方面至第四方面的有益效果,可以参考第一方面中,在此不再赘述。
附图说明
[0021]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0022]图1为本专利技术实施例提供的表格结构识别方法的流程示意图之一;
[0023]图2为本专利技术实施例提供的表格结构识别方法的流程示意图之二;
[0024]图3为本专利技术实施例提供的表格结构识别方法的流程示意图之三;
[0025]图4为本专利技术实施例提供的表格结构识别方法的流程示意图之四;
[0026]图5为本专利技术实施例提供的表格结构识别装置的结构示意图;
[0027]图6为本专利技术实施例提供的电子设备的结构示意图。
具体实施方式
[0028]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施
例的组件可以以各种不同的配置来布置和设计。
[0029]因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0031]在本专利技术的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该专利技术产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0032]此外,术语“水平”、“竖直”等术语并不表示要求部件绝对水平或悬垂,而是可以稍微倾斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构一定要完全水平,而是可以稍微倾斜。
[0033]在本专利技术的描述中,还需要说明的是,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格结构识别方法,其特征在于,包括:获取目标图像,所述目标图像为包括表格结构的图像;将所述目标图像输入到语义分割模型,输出所述目标图像中的表格分隔线,所述表格分隔线包括横分隔线和竖分隔线,所述语义分割模型具备识别所述目标图像中的有线表格分隔线和无线表格分隔线的能力;根据所述表格分隔线确定所述表格结构的单元格;匹配所述单元格和所述表格结构中各单元格的文本,以确定所述表格结构。2.如权利要求1所述的方法,其特征在于,所述根据所述表格分隔线确定所述表格结构的单元格,包括:确定各所述表格分隔线间的交点;按列从左到右、按列从右到左、按行从上到下以及按行从下到上中的至少两个方向遍历所述交点;若存在四个交点,所述四个交点中任意相邻的两个所述交点均处于同一表格分隔线中,则确定所述四个交点围成一个单元格。3.如权利要求1或2所述的方法,其特征在于,所述获取目标图像,包括:确定待识别图像中的表格结构的位置信息;根据所述位置信息裁剪所述待识别图像,以得到所述目标图像。4.如权利要求3所述的方法,其特征在于,在所述获取目标图像之前,所述方法还包括:识别所述待识别图像中的文本;根据所述文本的方向,调整所述待识别图像以使所述文本的方向调整为可读方向。5.如权利要求1所述的方法,其特征在于,语义分割模型采用数据集训练,所述数据集包括多个包含表格结构的图像,且各图像中对表格结构的表格分隔线进行了标注。6.一种表格结构识别装置,其特征在于,包...

【专利技术属性】
技术研发人员:陈海波李阁
申请(专利权)人:深延科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1