一种具有在线自动优化功能的OCR识别方法及系统技术方案

技术编号：36550696 阅读：25 留言：0更新日期：2023-02-04 17:04

本发明专利技术涉及一种具有在线自动优化功能的OCR识别方法及系统，该方法包括：S1、获取待识别OCR识别训练图像集，预处理得到初始训练数据集；S2、采用目标检测算法和文本识别算法，对初始训练数据集依次进行文本定位和文本识别，训练得到初始OCR识别模型；S3、将初始OCR识别模型部署到实际生产中，每隔设定时间进行识别结果和校对结果的比对，并收集识别错误的原始图像样本；触发优化信号阈值时，转S4；S4、进行异常要素统计，构建优化数据集；S5、基于优化数据集，对初始OCR识别模型进行优化训练，得到优化后的OCR识别模型，并将其作为S3中的初始OCR模型部署至实际生产中，进行OCR识别。与现有技术相比，本发明专利技术可实现对图像的在线自动优化OCR识别。OCR识别。OCR识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种具有在线自动优化功能的OCR识别方法及系统

[0001]本专利技术涉及OCR识别
，尤其是涉及一种具有在线自动优化功能的OCR识别方法及系统。

技术介绍

[0002]现代社会生活特别是金融行业中使用到了大量的纸质凭证、表单等，用于各类申请、管理等业务。随着社会信息化程度的进一步加深，有越来越多的场景需要将实际生活中的纸质材料信息录入到计算机中。传统的方式是人工进行录入，录入过程重复且繁琐。随着扫描技术和深度学习技术的发展，用于替代人工录入方式的OCR识别技术也得到了进一步发展。OCR文字识别，即光学字符识别，是指将纸面上的文字灰度变换成电信号，输入到计算机中去，文字识别技术大大降低了重复的工作量，可以为人们提供便利的将图片转为文字的方法。
[0003]现在的OCR识别技术基本多以深度学习技术为基础，基本流程为根据已有数据训练文字定位和识别模型，将训练好的模型部署到实际生产环境中。这里会出现的问题是训练使用的数据可能无法完全满足生产的实际需求，部分实际场景中的凭证不符合训练拟合的标准，或者由于实际情况的变化，例如凭证的版面、录入设别环境等因素发生了变化影响了模型的识别过程，造成识别错误。通常的解决方案是收集错误样本积累到一定规模之后优化训练模型，优化周期较长，人工干预较多，且可能出现生产数据泄露等风险。
[0004]针对上述缺陷，继续设计一种能够在线自动优化的OCR识别方法及系统。

技术实现思路

[0005]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供了一种具有在线...

【技术保护点】

【技术特征摘要】
1.一种具有在线自动优化功能的OCR识别方法，其特征在于，该方法包括以下步骤：步骤S1、获取待识别的OCR识别训练图像集并进行标注，得到初始训练数据集；步骤S2、采用目标检测算法和文本识别算法，对初始训练数据集依次进行文本定位和文本识别，训练得到初始OCR识别模型；步骤S3、将初始OCR识别模型部署到实际生产中，每隔设定时间进行识别结果和校对结果的比对，并收集识别错误的原始图像样本；当触发设定的优化信号阈值时，转步骤S4，启动模型优化进程；步骤S4、进行异常要素统计，并按照设定的概率合成图像样本，与错误样本和异常时间段区间样本合并构成优化数据集；步骤S5、基于优化数据集，对初始OCR识别模型进行优化训练，得到优化后的OCR识别模型，并将其作为步骤S3中的初始OCR模型部署至实际生产中，进行OCR识别。2.根据权利要求1所述的一种具有在线自动优化功能的OCR识别方法，其特征在于，所述步骤S1中的标注包括对识别要素的文本区域和每个文本区域对应的文本内容信息进行标注。3.根据权利要求2所述的一种具有在线自动优化功能的OCR识别方法，其特征在于，所述文本区域为完整覆盖文本在图像中位置的矩形区域；所述文本区域的标注结果为四个坐标的形式，分别对应矩形区域四个边角的坐标。4.根据权利要求1所述的一种具有在线自动优化功能的OCR识别方法，其特征在于，所述步骤S2中的目标检测算法包括YOLO v3、YOLO v4和Mask RCNN算法。5.根据权利要求1所述的一种具有在线自动优化功能的OCR识别方法，其特征在于，所述步骤S2中的文本识别算法包括CRNN、SRN和RARE算法。6.根据权利要求1所述的一种具有在线自动优化功能的OCR识别方法，其特征在于，所述步骤S3中的优化信号为识别准确率。7.根据权利要求1所述的一种具有在线自动优化功能的OCR识别方法，其特征在于，所述步骤S4中的异常要素统计包括异常字统计、错误语料统计、相似语料搜索、文本位置区间统计、字体背景分离、相似字体收集以及相似背景收集，分别为：1)异常字统计：对出现识别错误图片对应的校验结果逐个统计，筛选出训练样本中未出现或出现频次低于设定值的字符，进行重点标记，在后续的合成过程中提高异常字出现在优化数据集中的频率；2)错误语料统计：逐个记录出现识别错误图片对应的校验结果语料，生成错误语料库，并统计语料字数范围；3)相似语料搜索：根据统计出的错误语料在构建的语料数据库中通过相似度检索算法进行检索；4...

【专利技术属性】
技术研发人员：郭宇轩，
申请(专利权)人：交通银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人