【技术实现步骤摘要】
文本检测模型的训练方法、装置及可读存储介质
[0001]本公开涉及计算机
,尤其涉及一种文本检测模型的训练方法、装置及可读存储介质。
技术介绍
[0002]在“人工智能(artificial intelligence,AI)+教育”场景中,对图像文本进行文本行的定位,以及手写文本、公式文本等多个文本类型的文本检测是进行版面还原和内容理解的前置环节。目前,通常采用基于像素分割的文本检测方式实现不同文本类型的文本检测。具体地,利用文本检测模型对图像文本进行特征提取,并根据提取的特征图对图像文本中的像素点进行分类预测;接着,根据分类预测结果提取各文本类型的连通域作为后续文本识别的文本检测实例。
[0003]对于密集型文本,为了避免文本行的粘连问题,文本检测模型会预测一个或者多个相同形状但大小不同的文本区域,这些文本区域通常小于真实文本区域。现有技术中,文本检测模型是采用多边形裁剪算法,根据真实文本区域的面积和周长确定缩小距离,并根据确定的缩小距离将真实文本区域进行缩小,从而获得上述预测的文本区域。
[0004 ...
【技术保护点】
【技术特征摘要】
1.一种文本检测模型的训练方法,其特征在于,包括:获取训练样本,其中,所述训练样本的标准检测结果包括:至少一个标准文本区域以及各所述标准文本区域所属的文本类型标识;所述标准文本区域是通过对初始文本区域进行缩小后获得的,且缩小距离是根据所述初始文本区域的长和宽中的最小值确定的;将所述训练样本输入至初始文本检测模型,获取所述训练样本的多个检测结果,每个所述检测结果包括至少一个文本区域以及各所述文本区域所属的文本类型标识;根据预设的损失函数、所述多个检测结果以及所述标准检测结果,获取第一损失值;根据所述第一损失值对所述初始文本检测模型进行训练,直至训练次数满足预设迭代次数,获取文本检测模型。2.根据权利要求1所述的文本检测模型的训练方法,其特征在于,对所述初始文本区域进行缩小时的缩小距离满足公式:其中,d表示缩小距离;w表示所述初始文本区域的长;h表示所述初始文本区域的宽;a表示超参数。3.根据权利要求1或2所述的文本检测模型的训练方法,其特征在于,所述初始文本检测模型包括特征提取子模型、特征融合子模型以及分类预测子模型;所述将所述训练样本输入至初始文本检测模型,获取所述训练样本的多个检测结果,包括:将所述训练样本输入至所述特征提取子模型,提取所述训练样本的多个尺度不同的第一特征图、所述训练样本的多个尺度不同的第二特征图以及第一检测结果;通过所述特征融合子模型对第三特征图和第四特征图进行融合,输出第一融合特征图;其中,所述多个尺度不同的第一特征图包括所述第三特征图,所述多个尺度不同的第二特征图包括所述第四特征图,且所述第三特征图与所述第四特征图尺度相同;将所述第一融合特征图与所述第一检测结果进行融合,获取第二融合特征图;并将所述第二融合特征图输入至所述分类预测子模型,获取第二检测结果;所述多个检测结果包括所述第一检测结果和所述第二检测结果。4.根据权利要求3所述的文本检测模型的训练方法,其特征在于,所述特征提取子模型包括:第一特征提取子模型和第二特征提取子模型;所述第一特征提取子模型,用于对所述训练样本的原始特征图进行多次下采样处理,提取所述多个尺度不同的第一特征图;所述第二特征提取子模型,用于对尺度最小的第一特征图进行多次上次样处理,提取所述多个尺度不同的第二特征图;并根据尺度最大的第二特征图,获取所述第一检测结果。5.根据权利要求3所述的文本检测模型的训练方法,其特征在于,所述第三特征图为所述多个尺度不同的第一特征图中尺度最大的第一特征图;所述第四特征图为与所述第三特征图尺度相同的第二特征图。6.根据权利...
【专利技术属性】
技术研发人员:王德强,刘霄,熊泽法,
申请(专利权)人:北京世纪好未来教育科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。