表格框线的提取方法、装置以及存储介质制造方法及图纸

技术编号:38356139 阅读:8 留言:0更新日期:2023-08-05 17:27
本申请公开了一种表格框线的提取方法、装置以及存储介质。其中,一种表格框线的提取方法,包括:将包含表格的第一图像输入编码网络,并通过编码网络中的编码模块的编码操作,生成与第一图像对应的特征图;以及将特征图输入至与编码网络对应的解码网络,并通过解码网络中的解码模块的解码操作,生成与第一图像对应的第二图像,并且其中编码模块的编码操作包括:通过编码模块的第一卷积单元对输入编码模块的第一输入信息进行特征提取,得到第一特征信息;通过编码模块的第二卷积单元对第一输入信息进行特征提取得到第二特征信息;将第一特征信息和第二特征信息进行融合得到融合特征信息;以及将融合特征信息通过下采样得到下采样特征信息。特征信息。特征信息。

【技术实现步骤摘要】
表格框线的提取方法、装置以及存储介质


[0001]本申请涉及图像处理
,特别是涉及一种表格框线的提取方法、装置以及存储介质。

技术介绍

[0002]通常情况下,工作人员会通过扫描仪等扫描工具,将含有表格的纸质文件扫描为PDF或者图片等电子文件。在扫描过程中,由于扫描空间狭小的问题,不可避免地会对纸质文件进行一些或大或小的遮挡,这样的话就会无法识别扫描得到的电子文件中被遮挡的表格区域。
[0003]如今,人们想要识别电子文件中的表格区域,通常使用语义分割网络来提取电子文件中的表格框线。其中电子文件中的表格框线提取方法,主要通过语义分割网络(例如为U

Net)来进行表格框线生成。
[0004]但是由于U

Net模型为四层深度,该模型深度过大,因此识别表格框线的的时间就会过长,从而降低了识别表格框线的速度。
[0005]并且U

Net模型的卷积层的通道数量最多就可以达到1024个,卷积通道数量过多,网络的计算复杂度也会相应地增加,训练速度将变得非常慢,需要更长的时间和更大的存储空间才能完成训练,从而就会造成训练速度慢,进而造成无法及时识别表格框线的问题。
[0006]针对上述的现有技术中存在的在利用语义分割网络识别表格框线的情况下,由于语义分割网络的深度过大以及通道数据过多,所造成的识别速度低的技术问题,目前尚未提出有效的解决方案。

技术实现思路

[0007]本申请的实施例提供了一种表格框线的提取方法、装置以及存储介质,以至少解决现有技术中存在的在利用语义分割网络识别表格框线的情况下,由于语义分割网络的深度过大以及通道数据过多,所造成的识别速度低的技术问题。
[0008]根据本申请实施例的一个方面,提供了一种表格框线的提取方法,包括:将包含表格的第一图像输入编码网络,并通过编码网络中的编码模块的编码操作,生成与第一图像对应的特征图;以及将特征图输入至与编码网络对应的解码网络,并通过解码网络中的解码模块的解码操作,生成与第一图像对应的第二图像,其中第二图像用于指示从第一图像提取的与表格对应的框线,并且其中编码模块的编码操作包括:通过编码模块的第一卷积单元对输入编码模块的第一输入信息进行特征提取,得到第一特征信息;通过编码模块的第二卷积单元对第一输入信息进行特征提取得到第二特征信息;将第一特征信息和第二特征信息进行融合得到融合特征信息;以及将融合特征信息通过下采样得到下采样特征信息。
[0009]根据本申请实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
[0010]根据本申请实施例的另一个方面,还提供了一种表格框线的提取装置,包括:第一生成模块,用于将包含表格的第一图像输入编码网络,并通过编码网络中的编码模块的编码操作,生成与第一图像对应的特征图;以及第二生成模块,用于将特征图输入至与编码网络对应的解码网络,并通过解码网络中的解码模块的解码操作,生成与第一图像对应的第二图像,其中第二图像用于指示从第一图像提取的与表格对应的框线,并且其中编码模块的编码操作包括:通过编码模块的第一卷积单元对输入编码模块的第一输入信息进行特征提取,得到第一特征信息;通过编码模块的第二卷积单元对第一输入信息进行特征提取得到第二特征信息;将第一特征信息和第二特征信息进行融合得到融合特征信息;以及将融合特征信息通过下采样得到下采样特征信息。
[0011]根据本申请实施例的另一个方面,还提供了一种表格框线的提取装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:将包含表格的第一图像输入编码网络,并通过编码网络中的编码模块的编码操作,生成与第一图像对应的特征图;以及将特征图输入至与编码网络对应的解码网络,并通过解码网络中的解码模块的解码操作,生成与第一图像对应的第二图像,其中第二图像用于指示从第一图像提取的与表格对应的框线,并且其中编码模块的编码操作包括:通过编码模块的第一卷积单元对输入编码模块的第一输入信息进行特征提取,得到第一特征信息;通过编码模块的第二卷积单元对第一输入信息进行特征提取得到第二特征信息;将第一特征信息和第二特征信息进行融合得到融合特征信息;以及将融合特征信息通过下采样得到下采样特征信息。
[0012]在本申请实施例中,表格框线提取模型通过一个编码模块对第一图像进行下采样,并通过两个解码模块对下采样后的特征图进行上采样,得到提取了表格框线的第二图像。从而计算设备通过两层深度的表格框线提取模型,对表格框线进行提取。通过实验发现,本技术方案中的两层深度的表格框线提取模型与U

Net相比,在识别准确率上几乎没有差别,但是表格框线提取模型却比U

Net的识别速度高3倍。并且本技术方案中的表格框线提取模型的预先设定的卷积核,可以有效控制卷积层的通道数量,从而可以减少网络的计算复杂度,提高模型的训练速度。并且随着网络深度增加,内存消耗也会增加,无法承载较大的输入图像。从而本技术方案中较浅的表格框线提取模型则可以减少内存消耗,提高模型的可扩展性。并且较浅的表格框线提取模型具有更少的参数,使得模型更容易被优化和训练,提高计算效率。并且由于表格框线提取模型参数量较少,模型复杂度较低,因此泛化能力更好,对少量的训练数据也能表现出良好的性能,从而降低了过拟合的风险。进而解决了现有技术中存在的在利用语义分割网络识别表格框线的情况下,由于语义分割网络的深度过大以及通道数据过多,所造成的识别速度低的技术问题。
附图说明
[0013]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0014]图1是用于实现根据本申请实施例1所述的方法的计算设备的硬件结构框图;
[0015]图2是根据本申请实施例1所述的表格框线提取模型的结构示意图;
[0016]图3是根据本申请实施例1所述的表格框线提取模型的模块结构示意图;
[0017]图4是根据本申请实施例1所述的表格框线提取模型的另一个结构示意图;
[0018]图5是根据本申请实施例1所述的表格框线提取模型的另一个模块结构示意图;
[0019]图6是根据本申请实施例1的第一个方面所述的表格框线的提取方法的流程示意图;
[0020]图7是根据本申请实施例2所述的表格框线的提取装置的示意图;以及
[0021]图8是根据本申请实施例3所述的表格框线的提取装置的示意图。
具体实施方式
[0022]为了使本
的人员更好地理解本申请的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格框线的提取方法,其特征在于,包括:将包含表格的第一图像输入编码网络,并通过所述编码网络中的编码模块的编码操作,生成与所述第一图像对应的特征图;以及将所述特征图输入至与所述编码网络对应的解码网络,并通过所述解码网络中的解码模块的解码操作,生成与所述第一图像对应的第二图像,其中所述第二图像用于指示从所述第一图像提取的与所述表格对应的框线,并且其中所述编码模块的编码操作包括:通过所述编码模块的第一卷积单元对输入所述编码模块的第一输入信息进行特征提取,得到第一特征信息;通过所述编码模块的第二卷积单元对所述第一输入信息进行特征提取得到第二特征信息;将所述第一特征信息和所述第二特征信息进行融合得到融合特征信息;以及将所述融合特征信息通过下采样得到下采样特征信息。2.根据权利要求1所述的方法,其特征在于,通过所述编码模块的第一卷积单元对输入所述编码模块的第一输入信息进行特征提取,得到第一特征信息的操作,包括:利用所述第一卷积单元的卷积层对所述第一输入信息进行特征提取,其中所述卷积层至少包含以下四个卷积核:至少包含以下四个卷积核:至少包含以下四个卷积核:以及3.根据权利要求2所述的方法,其特征在于,通过所述编码网络中的编码模块的编码操作,生成与所述第一图像对应的特征图的操作,包括:通过所述编码网络中包含的两个串行的编码模块,生成所述特征图。4.根据权利要求3所述的方法,其特征在于,通过所述编码网络中的编码模块的编码操作,生成的所述特征图的最小分辨率为128
×
128。5.根据权利要求4所述的方法,其特征在于,将所述特征图输入至与所述编码网络对应的解码网络的操作,包括:利用第一跳层连接模块将所述编码网络输出的所述特征图进行拼接处理,并将拼接处理后的特征图输入至所述解码网络。6.根据权利要求4所述的方法,其特征在于,所述解码模块的解码操作,包括:通过所述解码模块...

【专利技术属性】
技术研发人员:汪洋王佳梁韩宁
申请(专利权)人:北京杭升科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1