一种基于表单分割的实时文本检测方法技术

技术编号：40708697 阅读：3 留言：0更新日期：2024-03-22 11:09

本发明专利技术结合深度学习与计算机视觉算法，具体公开了一种基于表单分割的实时文本检测方法，该方法包括如下步骤：s1、通过相机扫描获取目标表单的图像信息；s2、将通过扫描获得的表单图像上传到服务器；s3、对上传的表单图像进行预处理，并将完整表单图像进行分割；s4、使用深度学习模型，分别检测分割后表单的文本信息，完成对各个分割表单的文本信息提取；s5、使用合并算法，将各个分割表单的文本检测结果进行合并，形成完整的表单检测结果；s6、将结果实时反馈。本发明专利技术方法通过使用深度学习模型对于表单的文本信息进行提取，使用切割合并算法，充分对分割后局部表单的文本信息进行整合，实现对表单数据实时检测。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术结合深度学习与计算机视觉算法，具体公开了一种基于表单分割的实时文本检测方法。

技术介绍

1、近年来，基于深度学习的自然场景文本检测已经成为计算机视觉领域和自然语言处理领域的一个重要研究方向，其利用神经网络自动学习高层次特征表示，取得的显著成果广泛应用于商业和工业领域。由于自然场景下，文本信息具有信息量大、分布不均匀等特点，因此自然场景下的表单文本检测一直是一个极具挑战性的难题，也是目前研究的热点。

2、自然场景下的文本检测一般是基于检测框，它通过检测包围框对自然图像中文本所在区域进行限定，但是这种方法设定的锚框一般都是规则的形状，在检测的不规则的文本时，检测性能会大大降低。因此这种方法只适合简单的自然场景。后来基于分割的文本检测方法被提出，它主要借鉴了经典的语义分割算法的思路，利用深度卷积和上采样进行特征提取和多级特征融合，通过对图像中每个像素分类来判断每个像素点是否属于文本区域，达到精准文本分割的目的。east通过利用全卷积网络fcn和非极大值抑制nms舍弃了中间不必要的步骤，有效减小了检测时间。不同于east网络基于检测框回归和图像分割的方法，dbnet在模型中添加了一个可学习阈值映射，通过图片特征学习像素阈值，这样无需计算二值图，提高了网络性能。但是，dbnet只关注预测文本区域的准确性，无视其他非文本区域类别的差异，导致学习到的特征较为分散。

3、现在的方法多是通过深度学习的方法进行表单的文本检测，但是通过语义分割的文本检测方法对繁杂和重叠文本的检测能力有限。

4、因此，结合

技术实现思路

1、本专利技术的目的在于提出一种基于表单分割的实时文本检测方法，其采用如下方案：

2、一种基于表单分割的实时文本检测方法，包括如下步骤：

3、s1、通过相机扫描获取目标表单的图像信息；

4、s2、将通过扫描获得的表单图像上传到服务器；

5、s3、对上传的表单图像进行预处理，并将完整表单图像进行分割；

6、s4、使用深度学习模型，分别检测分割后表单的文本信息，完成对各个分割表单的文本信息提取；

7、s5、使用合并算法，将各个分割表单的文本检测结果进行合并，形成完整的表单检测结果；

8、s6、将结果实时反馈。

9、进一步，上述步骤s1中，通过调整扫描相机角度，实时地捕获表单图像信息。

10、进一步，上述步骤s2中，需要将对于s1中获取到的表单图像每隔一定时间上传到指定的服务器中，检测表单中的文本信息。

11、进一步，上述步骤s3中，通过图像处理，将完整表单进行分割，根据深度学习算法中时间步长，每3秒检测一张表单图像。

12、进一步，上述步骤s4中，使用文本检测模型，对每个分割表单中的文本信息进行提取。

13、进一步，上述步骤s5中，根据s4分割表单中提取的文本信息计算各个分割文本框之间的iou，将分割后的检测结果进行合并。

14、进一步，数据处理的具体步骤为：

15、s51、通过文本检测模型，在步骤s4的基础上，完成对于表单文本信息的提取工作；

16、s52、通过对分割后检测结果的重定位，在步骤s51的基础上，实现分割表单结果的回归；

17、s53、通过计算各个分割表单检测结果的iou，在步骤s52的基础上，完成对分割表单检测结果的合并，提高文本检测的正确率和回归率；

18、进一步，上述步骤s6中，将s5中表单的文本检测结果进行实时的反馈。

19、本专利技术具有如下优点：

20、本专利技术方法通过深度神经网络与计算机视觉的方法，在将表单图像送入文本检测网络模型之前，把表单图像按照固定比例进行分割，大大地减少了每帧表单需要进行检测的目标，并且在检测完所有的分割表单后，又将各个分割表单的检测结果进行重定位，将检测结果回归到它们在完整表单中的位置，为避免合并时的漏检和误检，又通过计算分割表单文本检测框之间的iou，将所有结果进行完整地合并。相较于传统方法的方法，本专利技术方法考虑了表单图像特性，使得文本检测的准确率和召回率提高，对表单数据的文本信息提取的更准确和全面。

本文档来自技高网...

【技术保护点】

1.一种基于表单分割的实时文本检测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于表单分割的实时文本检测方法，其特征在于，所述步骤s1中，使用相机扫描表单，获取所需表单的图像信息。

3.根据权利要求1所述的一种基于表单分割的实时文本检测方法，其特征在于，所述步骤s2中，完成对于s1中扫描得到的表单数据上传服务器进行分析。

4.根据权利要求1所述的一种基于表单分割的实时文本检测方法，其特征在于，所述步骤s3中，完成对于表单图像的预处理，使用并将完整表单图像按一定比例进行分割，减少需要检测表单的文本目标数量，降低检测难度。

5.根据权利要求1所述的一种基于表单分割的实时文本检测方法，其特征在于，所述步骤s4中，将分割后的表单送入文本检测网络进行文本信息的提取。

6.根据权利要求1所述的一种基于表单分割的实时文本检测方法，其特征在于，所述步骤s5中，检测结果合并的具体处理过程如下：

7.根据权利要求1所述的一种基于表单分割的实时文本检测方法，其特征在于，所述步骤s6中，根据s5得到的文本检测结果完

...

【技术特征摘要】

1.一种基于表单分割的实时文本检测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于表单分割的实时文本检测方法，其特征在于，所述步骤s1中，使用相机扫描表单，获取所需表单的图像信息。

3.根据权利要求1所述的一种基于表单分割的实时文本检测方法，其特征在于，所述步骤s2中，完成对于s1中扫描得到的表单数据上传服务器进行分析。

4.根据权利要求1所述的一种基于表单分割的实时文本检测方法，其特征在于，所述步骤s3中，完成对于表单图像的预处理，使用并将完整表单图像按一定比例进行分割，减少需要检...

【专利技术属性】
技术研发人员：李宗民，戎光彩，徐畅，王立，白云，张明珠，
申请(专利权)人：中国石油大学华东，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人