一种OCR识别模型训练中的动态数据增强方法技术

技术编号:25186730 阅读:42 留言:0更新日期:2020-08-07 21:14
本发明专利技术提供一种OCR识别模型训练中的动态数据增强方法,步骤:S1:对原始数据进行标注处理,形成初始训练数据;S2:对初始训练数据进行文本识别的模型训练,获得文本识别模型;S3:在模型训练中使用文本识别模型对初始训练数据进行评估,划分不同类型,并根据评估结果判断初始训练数据的不同类型占比是否符合设定占比条件,符合转到步骤S5,不符合继续;S4:对设定类型的初始训练数据进行数据增强处理,与没有进行数据增强处理的其他类型的初始训练数据,作为下一轮的初始训练数据,返回步骤S2;S5:对每一轮文本识别模型的评估中,根据评估结果判断初始训练数据的不同类型占比是否符合设定占比条件,符合则认为已经形成目标模型,结束训练。

【技术实现步骤摘要】
一种OCR识别模型训练中的动态数据增强方法
本专利技术涉及一种OCR识别方法,尤其是涉及一种OCR识别模型训练中的动态数据增强方法。
技术介绍
使用数据增强技术主要是在训练数据上增加微小的扰动或者变化,一方面可以增加训练数据,提升模型的泛化能力,另一方面可以增加噪声数据,从而增加模型的鲁棒性。针对OCR文本数据增强,目前主要有两种思路:I.采用基于几何变换的方法(如空间几何变换、像素颜色变换、模糊)的固定组合或者随机组合对已有的训练样本进行数据增强,获取更为丰富的样本;II.由于OCR识别文本的内容非常广泛,如票据和行驶证中姓名和医院中的生僻字,通过样本的图像变换并不能增加该类样本的多样性,因此需要利用样本合成的思路进行数据增强,从而获得生僻字对应的训练样本。
技术实现思路
本专利技术提供了一种OCR识别模型训练中的动态数据增强方法,用于解决OCR识别模型训练的文本数据增强方式,通过深度学习中结合离线增强和在线增强来提升模型的泛化能力,从而克服以下问题:(1)目前的数据增强都是在训练模型之前操作的,训练集通常本文档来自技高网...

【技术保护点】
1.一种OCR识别模型训练中的动态数据增强方法,包括下列步骤:/nS1:对原始数据进行标注处理,形成初始训练数据,全部的初始训练数据作为总样本数据;/nS2:对初始训练数据进行文本识别的模型训练,获得文本识别模型;/nS3:在模型训练的过程中,使用文本识别模型对初始训练数据进行评估,将初始训练数据划分不同类型,并根据评估结果判断初始训练数据的不同类型占比是否符合设定占比条件,符合则转到步骤S5,如果不符合则继续向下处理;/nS4:对设定类型的初始训练数据进行数据增强处理,然后与没有进行数据增强处理的其他类型的初始训练数据,作为下一轮的初始训练数据,返回步骤S2;/nS5:对每一轮文本识别模型的...

【技术特征摘要】
1.一种OCR识别模型训练中的动态数据增强方法,包括下列步骤:
S1:对原始数据进行标注处理,形成初始训练数据,全部的初始训练数据作为总样本数据;
S2:对初始训练数据进行文本识别的模型训练,获得文本识别模型;
S3:在模型训练的过程中,使用文本识别模型对初始训练数据进行评估,将初始训练数据划分不同类型,并根据评估结果判断初始训练数据的不同类型占比是否符合设定占比条件,符合则转到步骤S5,如果不符合则继续向下处理;
S4:对设定类型的初始训练数据进行数据增强处理,然后与没有进行数据增强处理的其他类型的初始训练数据,作为下一轮的初始训练数据,返回步骤S2;
S5:对每一轮文本识别模型的评估中,根据评估结果判断初始训练数据的不同类型占比是否符合设定占比条件,符合则认为已经形成目标模型,结束训练。


2.根据权利要求1所述的OCR识别模型训练中的动态数据增强方法,其特征在于:步骤S1中,所述原始数据是将多行文本图片按照每行的排布进行分割处理,将多行文本图片切成的长条的文本图片。


3.根据权利要求2所述的OCR识别模型训练中的动态数据增强方法,其特征在于:步骤S1中,每个长条的文本图片和其对应标注的文字形成一个初始训练数据。


4.根据权利要求1所述的OCR识别模型训练中的动态数据增强方法,其特征在于:步骤S3中,所述评估是使用文本识别模型与初始训练数据对应标注的文字进行比对。

【专利技术属性】
技术研发人员:夏路遥侯进黄贤俊
申请(专利权)人:深源恒际科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1