OCR识别模型训练方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:37395785 阅读:27 留言:0更新日期:2023-04-27 07:33
本申请提供了一种OCR识别模型训练方法、装置、存储介质和计算机设备,方法包括:获取初始OCR识别模型的应用场景信息,并采集多个待标注图像;在各个待标注图像中提取目标待标注图像并发送到标注系统,以得到由人工标注的第一标注数据;将各个待标注图像发送到背景图提取器、字体分类器和语料筛选器,得到每个待标注图像的空白背景图、目标字体类型和目标语料数据,并根据预设增强算法,得到各个待标注图像的标注数据,并将各个待标注图像的标注数据作为第二标注数据;基于第一标注数据和第二标注数据,对初始OCR识别模型进行迭代训练,直至初始OCR识别模型满足预设条件,得到目标OCR识别模型。应用该方法,可以提升OCR模型训练的效率。率。率。

【技术实现步骤摘要】
OCR识别模型训练方法、装置、存储介质及计算机设备


[0001]本申请涉及计算机
,尤其涉及一种OCR识别模型训练方法、装置、存储介质及计算机设备。

技术介绍

[0002]伴随信息化和数字化的到来,现实场景有大量版式的文档和图片需要进行文字识别,将内部的内容智能识别和提取出来使用,如身份证、驾驶证、营业执照和护照等常见的证照,以及增值税普通发票和出租车小票等票据。
[0003]在现有方法中,若是针对每种版式的文档和图片研发独立的OCR识别模型,则需要耗费大量的人力和时间对每种版式的文档和图片进行数据标注,产生的大量标注数据,导致OCR识别模型的训练效率下降。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有的技术中需要耗费大量的人力和时间对每种版式的文档和图片进行数据标注,产生的大量标注数据,导致OCR识别模型的训练效率下降的缺陷。
[0005]第一方面,本申请提供了一种OCR识别模型训练方法,所述方法包括:
[0006]获取初始OCR识别模型的应用场景信息,并根据所述应用场景信息采集多个待标注图像;
[0007]对各个所述待标注图像进行筛选得到目标待标注图像;
[0008]将所述目标待标注图像发送到标注系统,以得到由人工标注的第一标注数据;
[0009]将各个所述待标注图像发送到背景图提取器、字体分类器和语料筛选器,得到每个所述待标注图像的空白背景图、目标字体类型和目标语料数据;
[0010]针对每个所述待标注图像,根据预设增强算法,将该待标注图像的所述空白背景图、所述目标字体类型和所述目标语料数据进行融合,得到该待标注图像的标注数据,并将各个所述待标注图像的标注数据作为第二标注数据;
[0011]基于所述第一标注数据和所述第二标注数据,对所述初始OCR识别模型进行迭代训练,直至所述初始OCR识别模型满足预设条件,并得到目标OCR识别模型。
[0012]在其中一个实施例中,所述基于所述第一标注数据和所述第二标注数据,对所述初始OCR识别模型进行迭代训练,直至所述初始OCR识别模型满足预设条件,并得到目标OCR识别模型的步骤,包括:
[0013]确定当前训练轮次是否为第一轮次;
[0014]若当前训练轮次为第一轮次,则基于所述第一标注数据和所述第二标注数据,对所述初始OCR识别模型进行训练;
[0015]若当前训练轮次为非第一轮次,则将上一轮次训练中识别不正确的标注数据作为当前轮次的难例数据,并基于所述当前轮次的难例数据、所述第一标注数据和所述第二标
注数据,对所述初始OCR识别模型进行训练;
[0016]当所述初始OCR识别模型满足预设条件时,得到目标OCR识别模型。
[0017]在其中一个实施例中,所述空白背景图的提取步骤,包括:
[0018]针对每个所述待标注图像,扫描并确定该所述待标注图像中各个文字位置,并将各个所述文字位置中的文字进行抹除,将抹除文字后的各个图像作为该待标注图像的所述空白背景图。
[0019]在其中一个实施例中,所述目标字体类型的获取步骤,包括:
[0020]根据所述应用场景信息,在字体采集系统采集到的字体库中确定与各个所述待标注图像对应的目标字体类型。
[0021]在其中一个实施例中,所述目标语料数据的获取步骤,包括:
[0022]基于所述应用场景信息,在语料采集系统采集到的语料库中确定与各个所述待标注图像对应的所述目标语料数据。
[0023]在其中一个实施例中,所述针对每个所述待标注图像,根据预设增强算法,将该待标注图像的所述空白背景图、所述目标字体类型和所述目标语料数据进行融合,得到该待标注图像的标注数据,并将各个所述待标注图像的标注数据作为第二标注数据的步骤,包括:
[0024]针对每个所述待标注图像,根据预设增强算法,基于该待标注图像的所述目标字体类型,将该待标注图像的所述目标语料数据填充到该待标注图像的所述空白背景图中,得到该待标注图像的标注数据;
[0025]将各个所述待标注图像的标注数据作为所述第二标注数据。
[0026]第二方面,本申请提供了一种OCR识别模型训练装置,所述装置包括:
[0027]待标注图像采集模块,用于获取初始OCR识别模型的应用场景信息,并根据所述应用场景信息采集多个待标注图像;
[0028]目标待标注图像筛选模块,用于对各个所述待标注图像进行筛选得到目标待标注图像;
[0029]第一标注数据获取模块,用于将所述目标待标注图像发送到标注系统,以得到由人工标注的第一标注数据;
[0030]待标注图像数据获取模块,用于将各个所述待标注图像发送到背景图提取器、字体分类器和语料筛选器,得到每个所述待标注图像的空白背景图、目标字体类型和目标语料数据;
[0031]第二标注数据获取模块,用于针对每个所述待标注图像,根据预设增强算法,将该待标注图像的所述空白背景图、所述目标字体类型和所述目标语料数据进行融合,得到该待标注图像的标注数据,并将各个所述待标注图像的标注数据作为第二标注数据;
[0032]OCR识别模型训练模块,用于基于所述第一标注数据和所述第二标注数据,对所述初始OCR识别模型进行迭代训练,直至所述初始OCR识别模型满足预设条件,并得到目标OCR识别模型。
[0033]在其中一个实施例中,所述OCR识别模型训练模块,包括:
[0034]训练轮次确定单元,用于确定当前训练轮次是否为第一轮次;
[0035]第一训练单元,用于若当前训练轮次为第一轮次,则基于所述第一标注数据和所
述第二标注数据,对所述初始OCR识别模型进行训练;
[0036]第二训练单元,用于若当前训练轮次为非第一轮次,则将上一轮次训练中识别不正确的标注数据作为当前轮次的难例数据,并基于所述当前轮次的难例数据、所述第一标注数据和所述第二标注数据,对所述初始OCR识别模型进行训练;
[0037]目标OCR识别模型获取单元,用于当所述初始OCR识别模型满足预设条件时,得到目标OCR识别模型。
[0038]第三方面,本申请提供了一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述实施例中任一项所述OCR识别模型训练方法的步骤。
[0039]第四方面,本申请提供了一种计算机设备,包括:一个或多个处理器,以及存储器;
[0040]所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行上述实施例中任一项所述OCR识别模型训练方法的步骤。
[0041]从以上技术方案可以看出,本申请实施例具有以下优点:
[0042]本申请提供了一种OCR识别模型训练方法、装置、存储介质和计算机设备,所述方法包括:获取初始OCR识别模型的应用场景信息,并根据所述应用场景信息采集多个待本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种OCR识别模型训练方法,其特征在于,所述方法包括:获取初始OCR识别模型的应用场景信息,并根据所述应用场景信息采集多个待标注图像;对各个所述待标注图像进行筛选得到目标待标注图像;将所述目标待标注图像发送到标注系统,以得到由人工标注的第一标注数据;将各个所述待标注图像发送到背景图提取器、字体分类器和语料筛选器,得到每个所述待标注图像的空白背景图、目标字体类型和目标语料数据;针对每个所述待标注图像,根据预设增强算法,将该待标注图像的所述空白背景图、所述目标字体类型和所述目标语料数据进行融合,得到该待标注图像的标注数据,并将各个所述待标注图像的标注数据作为第二标注数据;基于所述第一标注数据和所述第二标注数据,对所述初始OCR识别模型进行迭代训练,直至所述初始OCR识别模型满足预设条件,并得到目标OCR识别模型。2.根据权利要求1所述的OCR识别模型训练方法,其特征在于,所述基于所述第一标注数据和所述第二标注数据,对所述初始OCR识别模型进行迭代训练,直至所述初始OCR识别模型满足预设条件,并得到目标OCR识别模型的步骤,包括:确定当前训练轮次是否为第一轮次;若当前训练轮次为第一轮次,则基于所述第一标注数据和所述第二标注数据,对所述初始OCR识别模型进行训练;若当前训练轮次为非第一轮次,则将上一轮次训练中识别不正确的标注数据作为当前轮次的难例数据,并基于所述当前轮次的难例数据、所述第一标注数据和所述第二标注数据,对所述初始OCR识别模型进行训练;当所述初始OCR识别模型满足预设条件时,得到目标OCR识别模型。3.根据权利要求1所述的OCR识别模型训练方法,其特征在于,所述空白背景图的提取步骤,包括:针对每个所述待标注图像,扫描并确定该所述待标注图像中各个文字位置,并将各个所述文字位置中的文字进行抹除,将抹除文字后的各个图像作为该待标注图像的所述空白背景图。4.根据权利要求1所述的OCR识别模型训练方法,其特征在于,所述目标字体类型的获取步骤,包括:根据所述应用场景信息,在字体采集系统采集到的字体库中确定与各个所述待标注图像对应的目标字体类型。5.根据权利要求1所述的OCR识别模型训练方法,其特征在于,所述目标语料数据的获取步骤,包括:基于所述应用场景信息,在语料采集系统采集到的语料库中确定与各个所述待标注图像对应的所述目标语料数据。6.根据权利要求1所述的OCR识别模型训练方法,其特征在于,所述针对每个所述待标注图像,根据预设增强算法,将该待标注图像的所述空白背景图、所述目标字体类型和所述目标语料数据进行融合,得到该待标注图像的标注数据,...

【专利技术属性】
技术研发人员:卞晓瑜肖鸣林黄俊
申请(专利权)人:壹沓科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1