检测模型的训练方法、文本框的检测方法及装置制造方法及图纸

技术编号:41296722 阅读:13 留言:0更新日期:2024-05-13 14:45
本公开涉及一种检测模型的训练方法、文本框的检测方法及装置;上述训练方法包括:向待训练的检测模型输入携带文本标签的样本图像;文本标签包括:基准文本框和基准文本框内的文本上绘有预设删除符号的基准概率值;通过检测模型对样本图像进行检测,确定样本图像的文本检测结果,包括:预测文本框和预测文本框内的文本上绘有预设删除符号的预测概率值;根据目标损失函数对文本检测结果和文本标签进行收敛,得到训练后的检测模型;目标损失函数包括:用于评估预测文本框的准确性的第一损失函数,且当预测文本框与基准文本框之间的重叠度处于不同的重叠度区间时,第一损失函数设有权重不同的惩罚项。本公开能够提高文本框的召回率和准确率。

【技术实现步骤摘要】

本公开涉及图像处理,尤其涉及一种检测模型的训练方法、文本框的检测方法及装置


技术介绍

1、文本批改已应用于智能教育和办公等多个领域,文本框检测是文本批改中的重要组成部分,文本框的准确度将很大程度影响文本批改的结果。通常可以通过训练模型来检测文本框。在传统的模型训练方式中,会使用预先确定好的、固定不变的损失函数,以及标注一些负样本来训练模型。然而,这种方式训练得到的模型检测文本框的准确率低下、文本框召回偏低,难以满足文本批改场景需求。


技术实现思路

1、为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种检测模型的训练方法、文本框的检测方法及装置。

2、根据本公开的一方面,提供了一种检测模型的训练方法,包括:

3、向待训练的检测模型输入携带文本标签的样本图像;其中,所述文本标签包括:基准文本框和所述基准文本框内的文本上绘有预设删除符号的基准概率值;

4、通过所述待训练的检测模型对所述样本图像进行检测,确定所述样本图像的文本检测结果;其中,所述文本检测结果包括本文档来自技高网...

【技术保护点】

1.一种检测模型的训练方法,包括:

2.根据权利要求1所述的方法,所述待训练的检测模型包括:主干网络、第一分支网络和第二分支网络;所述通过所述待训练的检测模型对所述样本图像进行检测,确定所述样本图像的文本检测结果,包括:

3.根据权利要求1所述的方法,所述方法还包括:

4.根据权利要求3所述的方法,所述基于重叠度IoU损失函数和设有所述目标权重的惩罚项确定第一损失函数,包括:

5.根据权利要求1或3所述的方法,所述方法还包括:

6.根据权利要求5所述的方法,所述基于重叠度IoU损失函数确定的第一损失函数包括:

7.根...

【技术特征摘要】

1.一种检测模型的训练方法,包括:

2.根据权利要求1所述的方法,所述待训练的检测模型包括:主干网络、第一分支网络和第二分支网络;所述通过所述待训练的检测模型对所述样本图像进行检测,确定所述样本图像的文本检测结果,包括:

3.根据权利要求1所述的方法,所述方法还包括:

4.根据权利要求3所述的方法,所述基于重叠度iou损失函数和设有所述目标权重的惩罚项确定第一损失函数,包括:

5.根据权利要求1或3所述的方法,所述方法还包括:

6.根据权利要求5所述的方法,所述基于重叠度iou损失函数确定的第一损失函数包括:

7.根据权利要求5所述的方法,所述基于所述iou损失函数和设有目标权重的惩罚项确定的第一损失函数包括:

8.根据权...

【专利技术属性】
技术研发人员:李默楠
申请(专利权)人:深圳市星桐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1