图像文本检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号：40666303 阅读：5 留言：0更新日期：2024-03-18 19:01

本发明专利技术涉及图像文本识别技术领域，提供一种图像文本检测方法、装置、电子设备及存储介质，包括：标注初始图像中的多个文本检测框；确定多个文本检测框中的第一文本检测框和第二文本检测框；基于第一文本检测框，在初始图像上去除对应于第一文本检测框内的文本，得到再检图像；标注再检图像中的第三文本检测框；记录处于第一文本检测框中的文本图像，以及记录处于第三文本检测框中的文本图像。本发明专利技术通过在初始图像上进行正确检测和错误检测的文本分离，并在去除正确检测的文本的图像上对错误检测的文本再次检测，能够对字体较小且孤立的文本进行重点关注，更好的应对错误检测存在的问题，提高判断误检状况的准确率，提高特定目标检测能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像文本识别，尤其涉及一种图像文本检测方法、装置、电子设备及存储介质。

技术介绍

1、文本检测技术是指通过计算机视觉技术，自动识别图像或视频中的文本区域，并进行定位和提取的过程。而后通过文本识别技术将这些文本区域中的字符或单词转换为计算机可读的文本信息，即完成一套文本检测识别流程。该流程广泛应用于数字化档案管理、车牌识别、自然场景文字识别等领域。

2、常见的文本检测技术包括基于边缘检测、角点检测、连通组件分析、基于卷积神经网络等方法，这些算法可以实现字符级别、行级别或者段落级别的文本检测。

3、在现有的文本检测方案中，通常会出现文本漏检或误检的问题。文本漏检是指未检测到某些难例样本，文本误检是指将2行或多行距离较为接近的文本识别为一行文本。这些问题均会导致后续的文本识别流程不能获得正确的文本位置，从而无法对文本内容做出准确识别。

技术实现思路

1、针对现有技术存在的问题，本专利技术提供一种图像文本检测方法、装置、电子设备及存储介质。

2、本专利技术提供一种图像文本检测方法，包括：

3、标注初始图像中的多个文本检测框；所述初始图像为带有表单数据的图片，所述文本检测框用于限定行字段的区域；

4、根据多个文本检测框的位置信息，确定多个文本检测框中的第一文本检测框和第二文本检测框，所述第一文本检测框为正确限定行字段的检测框，所述第二文本检测框为错误限定行字段的检测框；

5、基于所述第一文本检测框，在所述初

6、标注所述再检图像中的第三文本检测框，所述第三文本检测框为正确限定处于所述第二文本检测框中行字段的检测框；

7、记录处于所述第一文本检测框中的文本图像，以及记录处于所述第三文本检测框中的文本图像。

8、在一个实施例中，所述根据多个文本检测框的位置信息，确定多个文本检测框中的第一文本检测框和第二文本检测框，包括：

9、根据多个文本检测框的位置信息，确定每个文本检测框的高度；

10、基于每个文本检测框的高度确定高度标准值；

11、将每个文本检测框的高度与所述高度标准值进行比较，确定多个文本检测框中的第一文本检测框和第二文本检测框。

12、在一个实施例中，所述基于每个文本检测框的高度确定高度标准值，包括：

13、将每个文本检测框的高度按从小到大的顺序排序得到高度序列，在所述高度序列的首位两端，去除预设数目的高度数据，得到剩余高度序列；

14、根据所述剩余高度序列计算期望值，将所述期望值作为高度标准值。

15、在一个实施例中，所述标注所述再检图像中的第三文本检测框，包括：

16、确定所述再检图像中的行字段的位置信息和单字符的位置信息；

17、根据单字符的位置信息对行字段的位置信息进行修正；

18、基于修正后的行字段的位置信息，在所述再检图像中标注出第三文本检测框。

19、本专利技术还提供一种图像文本检测装置，包括：

20、第一标注模块，用于标注初始图像中的多个文本检测框；所述初始图像为带有表单数据的图片，所述文本检测框用于限定行字段的区域；

21、判断模块，用于根据多个文本检测框的位置信息，确定多个文本检测框中的第一文本检测框和第二文本检测框，所述第一文本检测框为正确限定行字段的检测框，所述第二文本检测框为错误限定行字段的检测框；

22、生成模块，用于基于所述第一文本检测框，在所述初始图像上去除对应于所述第一文本检测框内的文本，得到再检图像；

23、第二标注模块，用于标注所述再检图像中的第三文本检测框，所述第三文本检测框为正确限定处于所述第二文本检测框中行字段的检测框；

24、记录模块，用于记录处于所述第一文本检测框中的文本图像，以及记录处于所述第三文本检测框中的文本图像。

25、在一个实施例中，所述判断模块具体用于：

26、根据多个文本检测框的位置信息，确定每个文本检测框的高度；

27、基于每个文本检测框的高度确定高度标准值；

28、将每个文本检测框的高度与所述高度标准值进行比较，确定多个文本检测框中的第一文本检测框和第二文本检测框。

29、在一个实施例中，所述判断模块在基于每个文本检测框的高度确定高度标准值的处理过程中，具体用于：

30、将每个文本检测框的高度按从小到大的顺序排序得到高度序列，在所述高度序列的首位两端，去除预设数目的高度数据，得到剩余高度序列；

31、根据所述剩余高度序列计算期望值，将所述期望值作为高度标准值。

32、在一个实施例中，所述第二标注模块具体用于：

33、确定所述再检图像中的行字段的位置信息和单字符的位置信息；

34、根据单字符的位置信息对行字段的位置信息进行修正；

35、基于修正后的行字段的位置信息，在所述再检图像中标注出第三文本检测框。

36、本专利技术还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述图像文本检测方法。

37、本专利技术还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述图像文本检测方法。

38、本专利技术还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述图像文本检测方法。

39、本专利技术提供的一种图像文本检测方法，通过在初始图像上进行正确检测和错误检测的文本分离，并在去除正确检测的文本的图像上对错误检测的文本再次检测，能够对字体较小且孤立的文本进行重点关注，更好的应对错误检测存在的问题，提高判断误检状况的准确率，提高特定目标检测能力。

本文档来自技高网...

【技术保护点】

1.一种图像文本检测方法，其特征在于，包括：

2.根据权利要求1所述的图像文本检测方法，其特征在于，所述根据多个文本检测框的位置信息，确定多个文本检测框中的第一文本检测框和第二文本检测框，包括：

3.根据权利要求2所述的图像文本检测方法，其特征在于，所述基于每个文本检测框的高度确定高度标准值，包括：

4.根据权利要求1所述的图像文本检测方法，其特征在于，所述标注所述再检图像中的第三文本检测框，包括：

5.一种图像文本检测装置，其特征在于，包括：

6.根据权利要求5所述的图像文本检测装置，其特征在于，所述判断模块具体用于：

7.根据权利要求6所述的图像文本检测装置，其特征在于，所述判断模块在基于每个文本检测框的高度确定高度标准值的处理过程中，具体用于：

8.根据权利要求5所述的图像文本检测装置，其特征在于，所述第二标注模块具体用于：

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至4任一项所述图像文本检测方法。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述图像文本检测方法。

...

【技术特征摘要】

1.一种图像文本检测方法，其特征在于，包括：

3.根据权利要求2所述的图像文本检测方法，其特征在于，所述基于每个文本检测框的高度确定高度标准值，包括：

4.根据权利要求1所述的图像文本检测方法，其特征在于，所述标注所述再检图像中的第三文本检测框，包括：

5.一种图像文本检测装置，其特征在于，包括：

6.根据权利要求5所述的图像文本检测装置，其特征在于，所述判断模块具体用于：<...

【专利技术属性】
技术研发人员：尤赟，谢骏，曾锴，侯成成，肖淳月，郭双双，李宁，潘贤真，陶涛，
申请(专利权)人：中国外运股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人