OCR识别模型训练方法、装置、存储介质及计算机设备制造方法及图纸

技术编号：37395785 阅读：27 留言：0更新日期：2023-04-27 07:33

本申请提供了一种OCR识别模型训练方法、装置、存储介质和计算机设备，方法包括：获取初始OCR识别模型的应用场景信息，并采集多个待标注图像；在各个待标注图像中提取目标待标注图像并发送到标注系统，以得到由人工标注的第一标注数据；将各个待标注图像发送到背景图提取器、字体分类器和语料筛选器，得到每个待标注图像的空白背景图、目标字体类型和目标语料数据，并根据预设增强算法，得到各个待标注图像的标注数据，并将各个待标注图像的标注数据作为第二标注数据；基于第一标注数据和第二标注数据，对初始OCR识别模型进行迭代训练，直至初始OCR识别模型满足预设条件，得到目标OCR识别模型。应用该方法，可以提升OCR模型训练的效率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
OCR识别模型训练方法、装置、存储介质及计算机设备

[0001]本申请涉及计算机
，尤其涉及一种OCR识别模型训练方法、装置、存储介质及计算机设备。

技术介绍

[0002]伴随信息化和数字化的到来，现实场景有大量版式的文档和图片需要进行文字识别，将内部的内容智能识别和提取出来使用，如身份证、驾驶证、营业执照和护照等常见的证照，以及增值税普通发票和出租车小票等票据。
[0003]在现有方法中，若是针对每种版式的文档和图片研发独立的OCR识别模型，则需要耗费大量的人力和时间对每种版式的文档和图片进行数据标注，产生的大量标注数据，导致OCR识别模型的训练效率下降。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一，特别是现有的技术中需要耗费大量的人力和时间对每种版式的文档和图片进行数据标注，产生的大量标注数据，导致OCR识别模型的训练效率下降的缺陷。
[0005]第一方面，本申请提供了一种OCR识别模型训练方法，所述方法包括：
[0006]获取初始OCR识别模型的应用场景信息，并根据所述应用场景信息采集多个待标注图像；
[0007]对各个所述待标注图像进行筛选得到目标待标注图像；
[0008]将所述目标待标注图像发送到标注系统，以得到由人工标注的第一标注数据；
[0009]将各个所述待标注图像发送到背景图提取器、字体分类器和语料筛选器，得到每个所述待标注图像的空白背景图、目标字体类型和目标语料数据；
[0010]针对每个所述...

【技术保护点】

【技术特征摘要】
1.一种OCR识别模型训练方法，其特征在于，所述方法包括：获取初始OCR识别模型的应用场景信息，并根据所述应用场景信息采集多个待标注图像；对各个所述待标注图像进行筛选得到目标待标注图像；将所述目标待标注图像发送到标注系统，以得到由人工标注的第一标注数据；将各个所述待标注图像发送到背景图提取器、字体分类器和语料筛选器，得到每个所述待标注图像的空白背景图、目标字体类型和目标语料数据；针对每个所述待标注图像，根据预设增强算法，将该待标注图像的所述空白背景图、所述目标字体类型和所述目标语料数据进行融合，得到该待标注图像的标注数据，并将各个所述待标注图像的标注数据作为第二标注数据；基于所述第一标注数据和所述第二标注数据，对所述初始OCR识别模型进行迭代训练，直至所述初始OCR识别模型满足预设条件，并得到目标OCR识别模型。2.根据权利要求1所述的OCR识别模型训练方法，其特征在于，所述基于所述第一标注数据和所述第二标注数据，对所述初始OCR识别模型进行迭代训练，直至所述初始OCR识别模型满足预设条件，并得到目标OCR识别模型的步骤，包括：确定当前训练轮次是否为第一轮次；若当前训练轮次为第一轮次，则基于所述第一标注数据和所述第二标注数据，对所述初始OCR识别模型进行训练；若当前训练轮次为非第一轮次，则将上一轮次训练中识别不正确的标注数据作为当前轮次的难例数据，并基于所述当前轮次的难例数据、所述第一标注数据和所述第二标注数据，对所述初始OCR识别模型进行训练；当所述初始OCR识别模型满足预设条件时，得到目标OCR识别模型。3.根据权利要求1所述的OCR识别模型训练方法，其特征在于，所述空白背景图的提取步骤，包括：针对每个所述待标注图像，扫描并确定该所述待标注图像中各个文字位置，并将各个所述文字位置中的文字进行抹除，将抹除文字后的各个图像作为该待标注图像的所述空白背景图。4.根据权利要求1所述的OCR识别模型训练方法，其特征在于，所述目标字体类型的获取步骤，包括：根据所述应用场景信息，在字体采集系统采集到的字体库中确定与各个所述待标注图像对应的目标字体类型。5.根据权利要求1所述的OCR识别模型训练方法，其特征在于，所述目标语料数据的获取步骤，包括：基于所述应用场景信息，在语料采集系统采集到的语料库中确定与各个所述待标注图像对应的所述目标语料数据。6.根据权利要求1所述的OCR识别模型训练方法，其特征在于，所述针对每个所述待标注图像，根据预设增强算法，将该待标注图像的所述空白背景图、所述目标字体类型和所述目标语料数据进行融合，得到该待标注图像的标注数据，...

【专利技术属性】
技术研发人员：卞晓瑜，肖鸣林，黄俊，
申请(专利权)人：壹沓科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人