一种用于文本缺陷检测模型的训练方法以及电子设备技术

技术编号：40935364 阅读：22 留言：0更新日期：2024-04-18 14:54

本发明专利技术公开了一种用于文本缺陷检测模型的训练方法、电子设备以及存储介质，包括：获取利用标注框标出缺陷区域的训练文本图像；生成与所述缺陷区域对应的高斯热力图；利用所述训练文本图像以及所述高斯热力图对所述文本缺陷检测模型进行训练，直至达到第一预设要求，完成对所述文本缺陷检测模型的训练。本发明专利技术为了能够识别出文本图像中的缺陷区域，对训练文本图像采用特定的标注方式进行标注并利用标注后的训练图像进行训练文本缺陷检测模型，使得该模型满足场景需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机，尤其涉及一种用于文本缺陷检测模型的训练方法以及电子设备。

技术介绍

1、图像作为信息传播的载体在越来越多的场景中被使用，对图像中的文本进行识别的需求也随之产生。目前，通常采用光学字符识别(optical character recognition，ocr)技术来识别图像中的文本。所述ocr技术可利用文本识别算法将图像中的文本(包括键入文本、印刷文本和/或手写文本等)转换为计算机文本。

2、生成文本图像的过程中，文本图像可能会存在各种缺陷，例如，在文本图像上可能会存在脏污、褶皱或者裂纹等。这些文本缺陷会严重影响文本识别的准确度。如何利用机器视觉技术来实现缺陷的精确检测和识别，同时还要兼顾到实时性，是一个很有挑战性的问题。

技术实现思路

1、本专利技术实施例提供一种用于文本缺陷检测模型的训练方法以及电子设备，用于至少解决以上提到的技术问题。

2、根据本专利技术的一个方面，提供一种用于文本缺陷检测模型的训练方法，包括：获取利用标注框标出缺陷区域的训练...

【技术保护点】

1.一种用于文本缺陷检测模型的训练方法，其特征在于，包括：

2.如权利要求1所述的训练方法，其特征在于，所述生成与所述缺陷区域的缺陷类型对应的高斯热力图，包括：

3.如权利要求1所述的训练方法，其特征在于，在所述缺陷区域与所述训练文本图像中的字符区域具有重叠区域的情况下，生成与所述缺陷区域对应的高斯热力图包括：

4.如权利要求1所述的训练方法，其特征在于，所述训练方法还利用所述训练文本图像与对应的字符高斯热力图以及相邻字符生成的字间高斯热力图对所述文本缺陷检测模型进行训练，直到达到第二预设要求，完成对所述文本缺陷检测模型的训练。p>

5.如权利...

【技术特征摘要】

1.一种用于文本缺陷检测模型的训练方法，其特征在于，包括：

2.如权利要求1所述的训练方法，其特征在于，所述生成与所述缺陷区域的缺陷类型对应的高斯热力图，包括：

4.如权利要求1所述的训练方法，其特征在于，所述训练方法还利用所述训练文本图像与对应的字符高斯热力图以及相邻字符生成的字间高斯热力图对所述文本缺陷检测模型进行训练，直到达到第二预设要求，...

【专利技术属性】
技术研发人员：徐海俊，孙新，
申请(专利权)人：苏州镁伽科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人