基于视觉提示的文本检测模型的训练方法及文本检测方法技术

技术编号：43379114 阅读：24 留言：0更新日期：2024-11-19 17:56

本申请实施例提供了基于视觉提示的文本检测模型的训练方法及文本检测方法，涉及图像处理技术领域。训练方法包括：获取样本图像集；提取样本图像的图像特征，并确定样本图像中文本区域的视觉提示特征；针对每张样本图像，将图像特征和各文本区域的视觉提示特征输入至文本检测模型，以使文本检测模型对图像特征和每一文本区域的视觉提示特征进行融合，基于融合特征，利用位置检测器进行预测，得到样本图像对应的预测结果；基于各样本图像的标签信息与对应的预测结果，对文本检测模型进行模型参数调整。应用本申请实施例提供的方案，可以在不依赖于待检测的工业场景的场景图像作为样本图像的前提下，训练得到适用于待检测的工业场景的文本检测模型。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像处理，特别是涉及基于视觉提示的文本检测模型的训练方法及文本检测方法。

技术介绍

1、当前，在很多工业场景中，需要对采集到的场景图像中的特定文本进行检测，例如，对生产车间中产品上所标注的生产日期进行检测等，以得到特定文本在场景图像中的位置，或者，特定文本的字符内容。

2、通常，相关技术中，为了实现对工业场景的场景图像中的特定文本的检测，可以采集工业场景中的场景图像作为样本图像，并将样本图像中的特定文本作为样本图像的标签，进而，利用带有标签的样本图像进行模型训练，得到用于对工业场景的场景图像中的特定文本进行检测的文本检测模型。

3、然而，由于工业场景的多样性相较于自然场景较低，所得到的样本图像的数量较少，甚至，在有些情况下，无法获取待检测的工业场景的场景图像作为样本图像。因此，亟需一种文本检测模型的训练方法，以在不依赖于待检测的工业场景的场景图像作为样本图像的前提下，训练得到适用于待检测的工业场景的文本检测模型。

技术实现思路

1、本申请实施例的目的在于提...

【技术保护点】

1.一种基于视觉提示的文本检测模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述针对每一张样本图像，分别将该样本图像的图像特征以及该样本图像中的各文本区域的视觉提示特征，输入至待训练的文本检测模型之前，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，每一张样本图像的标签信息还包括：该样本图像中的文本区域的字符内容；

4.根据权利要求2所述的方法，其特征在于，所述获取每一张样本图像中的各文本区域的文本提示信息，包括：

5.根据权利要求1-4任一项所述的方法，其特征在于，所述多个样本图像的采...

【技术特征摘要】

1.一种基于视觉提示的文本检测模型的训练方法，其特征在于，所述方法包括：

3.根据权利要求2所述的方法，其特征在于，每一张样本图像的标签信息还包括：该样本图像中的文本区域的字符内容；

4.根据权利要求2所述的方法，其特征在于，所述获取每一张样本图像中的各文本区域的文本提示信息，包括：

5.根据权利要求1-4任一项所述的方法，其特征在于，所述多个样本图像的采集方式，包括：

6.根据权利要求...

【专利技术属性】
技术研发人员：李潜，
申请(专利权)人：杭州海康机器人股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人