System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于人工智能领域,尤其涉及一种针对密集型表格的结构自动识别方法。
技术介绍
1、表格作为结构化信息的重要承载媒介,在出版、财务报告、发票和网页等多个领域发挥着关键作用。然而,手动处理大量表格数据既耗时又容易出错。为了提高效率和准确性,表格识别技术应运而生。表格结构识别(tsr)的目标是自动将图像或扫描文档中的表格结构与内容转化为计算机可理解的结构化数据形式,以实现对表格信息的自动处理和应用。传统的表格结构识别以启发式算法为主,而且对表格的结构做出了限定,因此往往只能处理简单的pdf文件等。而近年来,基于深度学习的方法在密集型表格识别任务上效果表现不好。
2、密集型表格指平均单元格高度很小的表格。本专利技术主要对密集型表格的结构自动识别进行了研究,设计了一种识别更加准确且速度更快的密集型表格识别方法。在实际应用中,如果能够快速准确的识别出表格结构,将大大简化手动处理过程。
技术实现思路
1、为了解决上述存在的问题,本专利技术提供一种针对密集型表格的结构自动识别方法。
2、本专利技术的一种针对密集型表格的结构自动识别方法,包括以下步骤:
3、步骤1:表格图片经过预处理,对图片做初步的调整。
4、步骤2:将一张表格图片输入dtablenet神经网络模型中;dtablenet神经网络模型包含骨干网络、行分隔符预测模块、列分隔符预测模块、合并单元格预测模块四部分。
5、步骤3:输入的表格经过骨干网络进行特征的初步提取。
...【技术保护点】
1.一种针对密集型表格的结构自动识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种针对密集型表格的结构自动识别方法,其特征在于,所述步骤1对图片的预处理主要包括背景填充、缩放、归一化、前景增强等操作,其中,背景填充采用自适应填充方法,填充的方法步骤为:
3.根据权利要求1所述的一种针对密集型表格的结构自动识别方法,其特征在于,所述DTableNet神经网络的骨干网络为残差网络ResNet18+金字塔特征融合网络BiFPN,包含若干卷积层、4个残差块、4个上采样层和4个下采样层;
4.根据权利要求1所述的一种针对密集型表格的结构自动识别方法,其特征在于,所述DTableNet神经网络输出的行列分隔符和合并单元格坐标三部分信息会和真实值对比,经过L1 loss和SmoothL1 loss损失函数得到各部分的损失,指导更新整个网络的参数值,循环往复,直到网络收敛。
5.根据权利要求1所述的一种针对密集型表格的结构自动识别方法,其特征在于,在自动识别表格结构时,先取行和列分隔符预测模块的输出,经过交叉得到精细的表格结构,再将
...【技术特征摘要】
1.一种针对密集型表格的结构自动识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种针对密集型表格的结构自动识别方法,其特征在于,所述步骤1对图片的预处理主要包括背景填充、缩放、归一化、前景增强等操作,其中,背景填充采用自适应填充方法,填充的方法步骤为:
3.根据权利要求1所述的一种针对密集型表格的结构自动识别方法,其特征在于,所述dtablenet神经网络的骨干网络为残差网络resnet18+金字塔特征融合网络bifpn,包含若干卷积层、4个残差块、4个上采样层和4个下采样层;
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。