无线表格识别方法及系统技术方案

技术编号：38037362 阅读：35 留言：0更新日期：2023-06-30 11:03

本发明专利技术提供一种无线表格识别方法及系统，方法包括：获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果；根据所述第一文本框识别结果和所述文本识别结果，得到候选无线表格识别结果；根据所述候选无线表格识别结果的合并特征，对所述候选无线表格识别结果进行调整，得到目标无线表格识别结果。所述系统执行所述方法。本发明专利技术能够解决现有无线表格识别方案中识别结果精度低的问题，提高了无线表格识别的精度。无线表格识别的精度。无线表格识别的精度。

全部详细技术资料下载

【技术实现步骤摘要】
无线表格识别方法及系统

[0001]本专利技术涉及计算机
，尤其涉及一种无线表格识别方法及系统。

技术介绍

[0002]随着电子信息的普及，大量的电子文档涌现出来，如何从这些文档中挖掘出有用的信息是信息时代的重中之重。在信息挖掘之前首先要面对的就是不同格式电子文件，有html、doc、pdf、扫描件、图片等，其中图片和扫描件的挖掘尤其困难，因为它是像素级编码的格式，需要通过计算机技术将像素编码翻译为类似LaTeX、html等编码形式。在信息文档中，无线表格能尽可能清晰、简洁高效的表达，但是真实的文档中，无线表格的变化是多种多样的，尤其是无线无线表格部分，有大量的布局形式是基于人的共识形成的，很难形成固定的程式以代码的形式描述。
[0003]在处理此类的无线无线表格时，一般基于深度学习思想进行端到端的无线表格识别，存在无线表格识别精度低的问题。

技术实现思路

[0004]本专利技术提供的无线表格识别方法及系统，用于解决现有技术中存在的基于深度学习思想对无线表格进行端到端识别精度低的问题。
[0005]本专利技术提供的一种无线表格识别方法，包括：
[0006]获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果；
[0007]根据所述第一文本框识别结果和所述文本识别结果，得到候选无线表格识别结果，所述候选无线表格识别结果为候选无线表格的识别结果，所述候选无线表格为基于所述第一文本框识别结果创建的无线表格；
[0008]根据所述候选无线表格识别结果的...

【技术保护点】

【技术特征摘要】
1.一种无线表格识别方法，其特征在于，包括：获取目标图像中的待识别无线表格的第一文本框识别结果和文本识别结果；根据所述第一文本框识别结果和所述文本识别结果，得到候选无线表格识别结果，所述候选无线表格识别结果为候选无线表格的识别结果，所述候选无线表格为基于所述第一文本框识别结果创建的无线表格；根据所述候选无线表格识别结果的合并特征，对所述候选无线表格识别结果进行调整，得到目标无线表格识别结果，所述合并特征为用于确定所述候选无线表格识别结果中的待合并行或待合并单元格的特征，所述待合并行为以行为单位，需要与相邻的上一行或相邻的下一行进行整体合并的行，所述待合并单元格为以单元格为单位，需要与相邻的上一单元格或相邻的下一单元格进行整体合并的单元格。2.根据权利要求1所述的无线表格识别方法，其特征在于，所述获取目标图像中的待识别无线表格的第一文本框识别结果，包括：将所述目标图像输入至第一检测模型，得到所述待识别无线表格的位置信息；基于第二检测模型，确定所述位置信息的候选文本框识别结果；根据所述候选文本框识别结果，确定所述第一文本框识别结果。3.根据权利要求2所述的无线表格识别方法，其特征在于，所述获取目标图像中的待识别无线表格的文本识别结果，包括：对所述候选文本框识别结果进行透视变换，得到第二文本框识别结果；将所述第二文本框识别结果输入至目标方向分类模型，得到第三文本框识别结果；将所述第三文本框识别结果输入至目标识别网络，得到所述文本识别结果。4.根据权利要求2所述的无线表格识别方法，其特征在于，所述根据所述候选文本框识别结果，确定所述第一文本框识别结果，包括：将所述候选文本框识别结果作为所述第一文本框识别结果；或者，计算所述候选文本框识别结果中的每列像素的方差；根据所述每列像素的方差，删除所述候选文本框识别结果中的文本行首尾多余的空白部分；根据所述文本行中文字间的空白间隔统计结果，确定第一裁切线；根据所述第一裁切线对所述候选文本框识别结果进行裁切，得到第一裁切结果；将所述第一裁切结果输入至目标自然语言处理模型，确定第二裁切线；根据所述第一裁切线和所述第二裁切线，确定目标裁切线；根据所述目标裁切线，对所述候选文本框识别结果进行裁切，得到第二裁切结果；根据预设过滤规则对所述第二裁切结果进行过滤，得到所述第一文本框识别结果。5.根据权利要求1所述的无线表格识别方法，其特征在于，所述根据所述第一文本框识别结果和所述文本识别结果，得到候选无线表格识别结果，包括：将所述第一文本框识别结果中的目标文本框进行合并，得到第一合并结果，所述目标文本框包括第一文本框和第二文本框，所述第一文本框为所述第一文本框识别结果中任意多个文本框之间的距离小于等于预设阈值的文本框，所述第二文本框为所述第一文本框识别结果中第一目标列中的文本框，所述第一目标列为所述第一文本框识别结果中包括一个
文本框的行数大于包括多个文本框的行数的列；将所述第一合并结果输入到目标自然语言处理模型，确定合并点；...

【专利技术属性】
技术研发人员：李俊，郎凯，
申请(专利权)人：北京感易智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人