表格框线的提取方法、装置以及存储介质制造方法及图纸

技术编号：38356139 阅读：8 留言：0更新日期：2023-08-05 17:27

本申请公开了一种表格框线的提取方法、装置以及存储介质。其中，一种表格框线的提取方法，包括：将包含表格的第一图像输入编码网络，并通过编码网络中的编码模块的编码操作，生成与第一图像对应的特征图；以及将特征图输入至与编码网络对应的解码网络，并通过解码网络中的解码模块的解码操作，生成与第一图像对应的第二图像，并且其中编码模块的编码操作包括：通过编码模块的第一卷积单元对输入编码模块的第一输入信息进行特征提取，得到第一特征信息；通过编码模块的第二卷积单元对第一输入信息进行特征提取得到第二特征信息；将第一特征信息和第二特征信息进行融合得到融合特征信息；以及将融合特征信息通过下采样得到下采样特征信息。特征信息。特征信息。

全部详细技术资料下载

【技术实现步骤摘要】
表格框线的提取方法、装置以及存储介质

[0001]本申请涉及图像处理
，特别是涉及一种表格框线的提取方法、装置以及存储介质。

技术介绍

[0002]通常情况下，工作人员会通过扫描仪等扫描工具，将含有表格的纸质文件扫描为PDF或者图片等电子文件。在扫描过程中，由于扫描空间狭小的问题，不可避免地会对纸质文件进行一些或大或小的遮挡，这样的话就会无法识别扫描得到的电子文件中被遮挡的表格区域。
[0003]如今，人们想要识别电子文件中的表格区域，通常使用语义分割网络来提取电子文件中的表格框线。其中电子文件中的表格框线提取方法，主要通过语义分割网络(例如为U
‑
Net)来进行表格框线生成。
[0004]但是由于U
‑
Net模型为四层深度，该模型深度过大，因此识别表格框线的的时间就会过长，从而降低了识别表格框线的速度。
[0005]并且U
‑
Net模型的卷积层的通道数量最多就可以达到1024个，卷积通道数量过多，网络的计算复杂度也会相应地增加，训练速度将变得非常慢，需要更长的时间和更大的存储空间才能完成训练，从而就会造成训练速度慢，进而造成无法及时识别表格框线的问题。
[0006]针对上述的现有技术中存在的在利用语义分割网络识别表格框线的情况下，由于语义分割网络的深度过大以及通道数据过多，所造成的识别速度低的技术问题，目前尚未提出有效的解决方案。

技术实现思路

[0007]本申请的实施例提供了一种表格框线的提取方法、装置以及...

【技术保护点】

【技术特征摘要】
1.一种表格框线的提取方法，其特征在于，包括：将包含表格的第一图像输入编码网络，并通过所述编码网络中的编码模块的编码操作，生成与所述第一图像对应的特征图；以及将所述特征图输入至与所述编码网络对应的解码网络，并通过所述解码网络中的解码模块的解码操作，生成与所述第一图像对应的第二图像，其中所述第二图像用于指示从所述第一图像提取的与所述表格对应的框线，并且其中所述编码模块的编码操作包括：通过所述编码模块的第一卷积单元对输入所述编码模块的第一输入信息进行特征提取，得到第一特征信息；通过所述编码模块的第二卷积单元对所述第一输入信息进行特征提取得到第二特征信息；将所述第一特征信息和所述第二特征信息进行融合得到融合特征信息；以及将所述融合特征信息通过下采样得到下采样特征信息。2.根据权利要求1所述的方法，其特征在于，通过所述编码模块的第一卷积单元对输入所述编码模块的第一输入信息进行特征提取，得到第一特征信息的操作，包括：利用所述第一卷积单元的卷积层对所述第一输入信息进行特征提取，其中所述卷积层至少包含以下四个卷积核：至少包含以下四个卷积核：至少包含以下四个卷积核：以及3.根据权利要求2所述的方法，其特征在于，通过所述编码网络中的编码模块的编码操作，生成与所述第一图像对应的特征图的操作，包括：通过所述编码网络中包含的两个串行的编码模块，生成所述特征图。4.根据权利要求3所述的方法，其特征在于，通过所述编码网络中的编码模块的编码操作，生成的所述特征图的最小分辨率为128
×
128。5.根据权利要求4所述的方法，其特征在于，将所述特征图输入至与所述编码网络对应的解码网络的操作，包括：利用第一跳层连接模块将所述编码网络输出的所述特征图进行拼接处理，并将拼接处理后的特征图输入至所述解码网络。6.根据权利要求4所述的方法，其特征在于，所述解码模块的解码操作，包括：通过所述解码模块...

【专利技术属性】
技术研发人员：汪洋，王佳梁，韩宁，
申请(专利权)人：北京杭升科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人