一种自学习字符识别方法技术

技术编号：27879900 阅读：15 留言：0更新日期：2021-03-31 01:12

本发明专利技术属于字符识别技术领域，具体涉及一种自学习字符识别方法，包括如下步骤：(1)图像预处理；(2)训练服务器；(3)字符检测；(4)特征提取；(5)分类器处理；(6)置信度判断；(7)模型训练，结果识别。本发明专利技术方法将模板匹配和深度学习结合起来，并且将端到端的字符识别网络拆分开，独立训练字符检测和识别分类两个模型，本发明专利技术可以快速响应新增字符识别需求，并且随着数据积累识别准确率不断提升，同时本发明专利技术方法中引入位置检测功能，提高了程序的执行的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种自学习字符识别方法
本专利技术属于字符识别
，具体涉及一种自学习字符识别方法。
技术介绍
目前的监控系统中广泛了字符识别功能，字符识别提供了监控场景中深层语义的理解。监控场景下，一般的字符识别工作流程是通过相机拍摄物件上的标记图像信息，然后通过识别装置中的算法进行图像中的字符识别，但是可以识别的字符种类是有限的，在系统运行过程中，如果出现了新的字符就会出现错误识别的情况。现有的字符识别方法包括模板匹配、深度学习网络识别等方法。其中模板匹配通过在已有数据中标注一个模板区域，然后在待分类的图像中检测目标字符的位置和类别，这种方法简单易用，出现新的字符的时候可以通过快速标定模板来实现新增字符的识别，但是模板匹配在复杂环境非标准字符识别中存在准确率低的问题，这是由于模板匹配算法的泛化能力较弱。深度学习网络识别是一种端到端的方法，可以同时实现字符定位和类别分类，泛化性能较好，但是深度学习网络需要大量的数据进行训练才能使用，不能实时的响应新增的字符识别需求。并且由于端到端的深度学习网络中的目标检测和分类之间存在特征冲突问题，识别准确率仍然存在提高的空间。
技术实现思路
本专利技术的目的在于提供一种自学习字符识别方法，解决了监控管理系统中，目标物体字符识别中出现新字符识别率低的问题。本专利技术的实现过程如下：一种自学习字符识别方法，包括如下步骤：(1)图像预处理通过相机获取图像数据，将图像数据进行预处理；(2)训练服务器训练服务器包括数据...

【技术保护点】
1.一种自学习字符识别方法，其特征在于，包括如下步骤：/n(1)图像预处理/n通过相机获取图像数据，将图像数据进行预处理；/n(2)训练服务器/n训练服务器包括数据集、模型训练、标签、位置检测、字符检测模型、分类模型，步骤(1)中通过相机获取图像数据同时上传数据集，当数据集的样本数量大于预设阈值时，进行模型训练，当模型训练结束后更新字符检测模型和分类模型，在使用过程中，位置检测辅助字符检测模型和分类模型；/n(3)字符检测/n将步骤(1)预处理之后的图像输入字符检测算法中，同时调取字符检测模型的数据从全图中检索出字符所在的位置，然后从全图中截取出字符所在的像素区域；同时将从全图中截取出字符所在的像素区域备份在更新模板库中；/n(4)特征提取/n将步骤(3)得到的字符所在的像素区域中每个像素区域分别送入特征提取算法中，输出每个字符对应的特征向量；/n(5)分类器处理/n将步骤(4)得到的每个字符对应的特征向量输入分类器算法中，同时调取分类模型的数据进行分类，输出每个字符对应的类别信息和置信度；/n(6)置信度判断/n逐个检查步骤(5)所检测出来的字符的置信度；/n当置信度大于预先设置的阈...

【技术特征摘要】
1.一种自学习字符识别方法，其特征在于，包括如下步骤：
(1)图像预处理
通过相机获取图像数据，将图像数据进行预处理；
(2)训练服务器
训练服务器包括数据集、模型训练、标签、位置检测、字符检测模型、分类模型，步骤(1)中通过相机获取图像数据同时上传数据集，当数据集的样本数量大于预设阈值时，进行模型训练，当模型训练结束后更新字符检测模型和分类模型，在使用过程中，位置检测辅助字符检测模型和分类模型；
(3)字符检测
将步骤(1)预处理之后的图像输入字符检测算法中，同时调取字符检测模型的数据从全图中检索出字符所在的位置，然后从全图中截取出字符所在的像素区域；同时将从全图中截取出字符所在的像素区域备份在更新模板库中；
(4)特征提取
将步骤(3)得到的字符所在的像素区域中每个像素区域分别送入特征提取算法中，输出每个字符对应的特征向量；
(5)分类器处理
将步骤(4)得到的每个字符对应的特征向量输入分类器算法中，同时调取分类模型的数据进行分类，输出每个字符对应的类别信息和置信度；
(6)置信度判断
逐个检查步骤(5)所检测出来的字符的置信度；
当置信度大于预先设置的阈值时，则该字符是识别正确的字符，该字符的类别就是检测出来的类别，得到识别结果；
(7)模型训练，结果识别
将步骤(6)的识别结果通过训练服务器中的模型训练传输到数据集中，其中传输的数据包括图像和字符标签。

2.根据权利要求1所述自学习字符识别方法，其特征在于：步骤(1)中，所述预处理指的是对图像大小进行调整、对图像按照百分比剪裁、对图片的亮度进行处理、对图像添加标记框或直方图均衡。

3.根据权利要求1所述自学习字符识别方法，其特征在于：步骤(6)中，当置信度小于预先设置的阈值时，则该字符是识别错误的字符；这时需要启用模板匹配算法识别，然后将识别结果通过训练服务器中的模型训练传输到数据集中，其中传输的数据包括图像和字符标签。

4.根据权利要求3所述自学习字符识别方法，其特征在于，所述模板匹配算法识别的具体过程为：将步骤(6)检测出来的置信度小于预先设...

【专利技术属性】
技术研发人员：任玉荣，梁晓锋，王伟平，段智强，杨涛，
申请(专利权)人：陕西天诚软件有限公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人