System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文本检测模型的训练方法、文本检测方法及相关设备技术_技高网

文本检测模型的训练方法、文本检测方法及相关设备技术

技术编号:40279859 阅读:9 留言:0更新日期:2024-02-07 20:34
本申请公开了一种文本检测模型的训练方法、文本检测方法及相关设备,用于提高文本检测模型的泛化性和检测准确性。所述文本检测模型的训练方法包括:获取样本图像集,样本图像集中的样本图像被标注有多种样本文本区域,多种样本文本区域包括通过人工标注方式得到的第一样本文本区域以及通过非人工标注方式得到的第二样本文本区域;通过待训练的文本检测模型对所述样本图像进行文本检测,得到样本图像的至少一个预测文本区域;基于所述至少一个预测文本区域、所述多种样本文本区域以及各种样本文本区域对应的损失权重,确定待训练的文本检测模型的检测损失值;基于检测损失值,更新待训练的文本检测模型的模型参数,得到训练后的文本检测模型。

【技术实现步骤摘要】

本申请涉及图像处理,尤其涉及一种文本检测模型的训练方法、文本检测方法及相关设备


技术介绍

1、随着文本检测算法的日渐成熟,已能自动化地应用于业务流中。但是,出于数据私密性和合规性的考虑,很对企业不希望把文本检测相关数据提交给算法提供方进行文字检测模型的优化,因此自训练文本检测模型的需求应运而生。自训练是指在私有化服务器上部署自训练系统,然后传入训练数据,经自训练系统自动训练后即可得到相应模型。自训练的优点就是数据是安全的,不需要外传。

2、目前,在对文本检测模型进行自训练时,由于用户在使用文本检测时通常只关心图像中的部分文本,因此在对用于训练模型的样本图像进行标注时,只会标注样本图像中的部分文本区域,这样就使得文本检测模型在训练过程中只将被标注图像区域认定为是文本区域,而将未标注的图像区域认定为是非文本区域,进而使得文本检测模型对是否是文本区域没有一个明确的分界线,最终导致文本检测模型的检测效果不佳;并且,样本图像中标注的部分文本区域之间在样本图像中的位置关系在泛化性能上较差,也会影响后续文本检测结果的准确性。


技术实现思路

1、本申请实施例的目的提供一种文本检测模型的训练方法、文本检测方法及相关设备,用于提高文本检测模型的泛化性和检测准确性。

2、为了实现上述目的,本申请实施例采用下述技术方案:

3、第一方面,本申请实施例提供一种文本检测模型的训练方法,包括:

4、获取样本图像集,所述样本图像集中的样本图像被标注有多种样本文本区域,所述多种样本文本区域包括通过人工标注方式得到的第一样本文本区域以及通过非人工标注方式得到的第二样本文本区域;

5、通过待训练的文本检测模型对所述样本图像进行文本检测,得到所述样本图像的至少一个预测文本区域;

6、基于所述至少一个预测文本区域、所述多种样本文本区域以及各种样本文本区域对应的损失权重,确定所述待训练的文本检测模型的检测损失值;

7、基于所述检测损失值,更新所述待训练的文本检测模型的模型参数,得到训练后的文本检测模型。

8、本申请实施例提供的文本检测模型的训练方法,获取经过人工标注和非人工标注两种方式标注的样本图像中的文本区域,从而可以确保样本图像集中的样本图像被标注有全量的样本文本区域,即图像中的所有文本区域都被标注出来;进一步,采用监督学习方式,基于这类样本图像集对文本检测模型进行训练,不仅使得文本检测模型能够更明确样本图像中的文本区域与非文本区域之间的边界,进而提高文本检测模型的文本检测效果,还使得文本检测模型能够在训练过程中能够学习到更多文本区域之间的坐标位置关系,提高文本检测模型的泛化性能,进而提高后续结构化任务上的泛化性;此外,在训练文本检测模型的过程中,还为每种样本文本区域引入对应的损失权重,基于文本检测模型对样本图像进行文本检测所得的预测文本区域、样本图像中的样本文本区域以及样本文本区域对应的损失权重,计算文本检测模型的检测损失,所得的检测损失能够更准确地反映文本检测模型的训练效果,进而基于检测损失更新文本检测模型的模型参数,有利于提高文本检测模型的训练效果,使得训练出的文本检测模型具有更高的准确性。

9、第二方面,本申请实施例提供一种文本检测方法,包括:

10、获取待检测的目标图像;

11、将所述目标图像输入训练后的文本检测模型,得到所述目标图像的预测文本区域,其中,所述训练后的文本检测模型为基于第一方面所述的文本检测模型的训练方法训练得到。

12、本申请实施例提供的文本检测方法,利用上述训练方法训练得到的文本检测模型可以准确对待检测图像进行文本检测,从而有利于提高文本检测精度。

13、第三方面,本申请实施例提供一种文本检测模型的训练装置,包括:

14、获取单元,用于获取样本图像集,所述样本图像集中的样本图像被标注有多种样本文本区域,所述多种样本文本区域包括通过人工标注方式得到的第一样本文本区域以及通过非人工标注方式得到的第二样本文本区域;

15、检测单元,用于通过待训练的文本检测模型对所述样本图像进行文本检测,得到所述样本图像的至少一个预测文本区域;

16、确定单元,用于基于所述至少一个预测文本区域、所述多种样本文本区域以及各种样本文本区域对应的损失权重,确定所述待训练的文本检测模型的检测损失值;

17、更新单元,用于基于所述检测损失值,更新所述待训练的文本检测模型的模型参数,得到训练后的文本检测模型。

18、第四方面,本申请实施例提供一种文本检测装置,包括:

19、获取单元,用于获取待检测的目标图像;

20、检测单元,用于将所述目标图像输入训练后的文本检测模型,得到所述目标图像的预测文本区域,其中,所述训练后的文本检测模型为基于第一方面所述的文本检测模型的训练方法训练得到。

21、第五方面,本申请实施例提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的文本检测模型的训练方法;或者,所述处理器被配置为执行所述指令,以实现如第二方面所述的文本检测方法。

22、第六方面,本申请实施例提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面所述的文本检测模型的训练方法;或者,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第二方面所述的文本检测方法。

本文档来自技高网...

【技术保护点】

1.一种文本检测模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个预测文本区域、所述多种样本文本区域以及各种样本文本区域对应的损失权重,确定所述待训练的文本检测模型的检测损失值,包括:

3.根据权利要求1所述的方法,其特征在于,所述第一样本文本区域对应的损失权重大于所述第二样本文本区域对应的损失权重。

4.根据权利要求1所述的方法,其特征在于,所述通过待训练的文本检测模型对所述样本图像进行文本检测,得到所述样本图像的至少一个预测文本区域,包括:

5.根据权利要求4所述的方法,其特征在于,所述第二样本文本区域在第t+1次训练时对应的损失权重小于或等于所述第二样本文本区域在第t次训练时对应的损失权重。

6.根据权利要求5所述的方法,其特征在于,在所述基于所述至少一个预测文本区域、所述多种样本文本区域以及各种样本文本区域对应的损失权重,确定所述待训练的文本检测模型的检测损失值之前,所述方法还包括:

7.根据权利要求1至6中任一项所述的方法,其特征在于,所述样本图像集中的样本图像通过如下方式得到:

8.一种文本检测方法,其特征在于,包括:

9.一种文本检测模型的训练装置,其特征在于,包括:

10.一种文本检测装置,其特征在于,包括:

11.一种电子设备,其特征在于,包括:

12.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至7中任一项所述的文本检测模型的训练方法;或者,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求8所述的文本检测方法。

...

【技术特征摘要】

1.一种文本检测模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个预测文本区域、所述多种样本文本区域以及各种样本文本区域对应的损失权重,确定所述待训练的文本检测模型的检测损失值,包括:

3.根据权利要求1所述的方法,其特征在于,所述第一样本文本区域对应的损失权重大于所述第二样本文本区域对应的损失权重。

4.根据权利要求1所述的方法,其特征在于,所述通过待训练的文本检测模型对所述样本图像进行文本检测,得到所述样本图像的至少一个预测文本区域,包括:

5.根据权利要求4所述的方法,其特征在于,所述第二样本文本区域在第t+1次训练时对应的损失权重小于或等于所述第二样本文本区域在第t次训练时对应的损失权重。

6.根据权利要求5所述的方法,其特征在于,在所述基于...

【专利技术属性】
技术研发人员:范峻植冉承祥杨烨陆全蒋宁
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1