文本检测模型训练方法、文本检测方法、装置及设备制造方法及图纸

技术编号：29972277 阅读：16 留言：0更新日期：2021-09-08 09:51

本发明专利技术公开了文本检测模型训练方法、文本检测方法、装置及设备。所述方法包括：获取设定数量的图像样本；分割各所述图像样本中所包括的文本区域，得到训练样本数据；使用所述训练样本数据对预先构建的多无锚区域候选网络进行训练，得到训练好的文本检测模型。利用该方法，能够提高场景文本检测效率。能够提高场景文本检测效率。能够提高场景文本检测效率。

全部详细技术资料下载

【技术实现步骤摘要】
文本检测模型训练方法、文本检测方法、装置及设备

[0001]本专利技术实施例涉及文化检测
，尤其涉及文本检测模型训练方法、文本检测方法、装置及设备。

技术介绍

[0002]文本检测就是要定位图像中的文字区域，然后通常以边界框的形式将单词或文本行标记出来。
[0003]由于文本自身宽高比的特殊性，一般的目标检测算法检测文本效果并不理想。相关技术在进行文本检测时，采用没有预设边框的检测网络。
[0004]但是应用于自然场景中的文本，又称场景文本，由于其在尺度、纵横比，特别是方向上的变化比一般物体的变化更大，使得在使用没有预设边框的检测网络对场景文本进行检测时效率低下。

技术实现思路

[0005]本专利技术实施例提供了文本检测模型训练方法、文本检测方法、装置及设备，提高了场景文本检测效率。
[0006]第一方面，本专利技术实施例提供了一种文本检测模型训练方法，包括：
[0007]获取设定数量的图像样本；
[0008]分割各所述图像样本中所包括的文本区域，得到训练样本数据；
[0009]使用所述训练样本数据对预先构建的多无锚区域候选网络进行训练，得到训练好的文本检测模型。
[0010]可选的，分割各所述图像样本中所包括的文本区域，得到训练样本数据，包括：
[0011]从所述图像样本中选取一个图像样本作为待标注图像；
[0012]获取所述待标注图像中文本区域的中心线；
[0013]根据所述中心线上的采样点，确定所述待标注图像上...

【技术保护点】

【技术特征摘要】
1.一种文本检测模型训练方法，其特征在于，包括：获取设定数量的图像样本；分割各所述图像样本中所包括的文本区域，得到训练样本数据；使用所述训练样本数据对预先构建的多无锚区域候选网络进行训练，得到训练好的文本检测模型。2.根据权利要求1所述的方法，其特征在于，分割各所述图像样本中所包括的文本区域，得到训练样本数据，包括：从所述图像样本中选取一个图像样本作为待标注图像；获取所述待标注图像中文本区域的中心线；根据所述中心线上的采样点，确定所述待标注图像上子图像的边界点；继续选取新的待标注图像确定对应的边界点直至所有图像样本均确定完对应的边界点；将各所述图像样本、各所述图像样本对应的边界点和各所述图像样本中心线上的采样点作为训练样本数据。3.根据权利要求2所述的方法，其特征在于，所述根据所述中心线上的采样点，确定所述待标注图像上子图像的边界点，包括：分别确定所述中心线上相邻两个采样点的中点在所述中心线上的切线；确定各切线的法线；将各所述法线与所述待标注图像中文本区域的交点和所述待标注图像中文本区域首尾的边界点，确定为所述待标注图像上子图像的边界点。4.根据权利要求2所述的方法，其特征在于，所述子图像的个数与所述采样点的个数相同，所述采样点作为对应子图像中心点均匀分布在对应的中心线上。5.根据权利要求1所述的方法，其特征在于，所述多无锚区域候选网络的损失函数基于中心点损失函数和边界点损失函数之和确定；所述中心点损失函数的计算方式如下：其中，K为采样点的数量，L
cls
为是否为文本中的点的损失函数，L
loc
为中心点位置的损失函数；所述边界点损失函数的计算方式如下：其中，L
loc
是边界点...

【专利技术属性】
技术研发人员：高凯珺，
申请(专利权)人：上海眼控科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人