字符识别方法及装置、电子设备、存储介质制造方法及图纸

技术编号：24939548 阅读：34 留言：0更新日期：2020-07-17 21:16

本申请提供一种字符识别方法及装置、电子设备、计算机可读存储介质，方法包括：采集待识别图像；将所述待识别图像作为已训练的目标检测网络的输入，获得所述目标检测网络输出的所述待识别图像的字符位置信息；从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像；将所述待识别子图像作为已训练的分类网络的输入，获得所述分类网络输出的所述待识别子图像中的字符；依据所述字符位置信息排序对应于每一字符位置信息的字符，得到字符识别结果。本申请通过依据深度学习的方法以定位加分类的方式，提高了复杂背景下字符识别正确率。

全部详细技术资料下载

【技术实现步骤摘要】
字符识别方法及装置、电子设备、存储介质
本申请涉及图像处理
，特别涉及一种字符识别方法及装置、电子设备、计算机可读存储介质。
技术介绍
光学字符识别(OCR，OpticalCharacterRecognition)是指电子设备通过检测图像上字符暗、亮的模式确定其形状，从而将形状翻译成计算机文字的过程。光学字符识别被广泛地应用于生产和生活的各类场景中。简单背景下的光学字符识别的正确率已经可以满足应用的需求，而对于复杂背景，识别正确率仍有较大的提升空间。
技术实现思路
本申请实施例的目的在于提供一种字符识别方法及装置、电子设备、计算机可读存储介质，用于提高复杂背景下的字符识别正确率。一方面，本申请提供了一种字符识别方法，包括：采集待识别图像；将所述待识别图像作为已训练的目标检测网络的输入，获得所述目标检测网络输出的所述待识别图像的字符位置信息；从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像；将所述待识别子图像作为已训练的分类网络的输入，获得所述分类网络输出的所述待识别子图像中的字符；依据所述字符位置信息排序对应于每一字符位置信息的字符，得到字符识别结果。在一实施例中，所述将所述待识别图像作为已训练的目标检测网络的输入，获得所述目标检测网络输出的所述待识别图像中的字符位置信息，包括：将所述待识别图像作为所述目标检测网络的输入，通过所述目标检测网络将所述待识别图像划分为多个单元格、对每一单元格计算得到边界框预测结果；其中，...

【技术保护点】
1.一种字符识别方法，其特征在于，包括：/n采集待识别图像；/n将所述待识别图像作为已训练的目标检测网络的输入，获得所述目标检测网络输出的所述待识别图像的字符位置信息；/n从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像；/n将所述待识别子图像作为已训练的分类网络的输入，获得所述分类网络输出的所述待识别子图像中的字符；/n依据所述字符位置信息排序对应于每一字符位置信息的字符，得到字符识别结果。/n

【技术特征摘要】
1.一种字符识别方法，其特征在于，包括：
采集待识别图像；
将所述待识别图像作为已训练的目标检测网络的输入，获得所述目标检测网络输出的所述待识别图像的字符位置信息；
从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像；
将所述待识别子图像作为已训练的分类网络的输入，获得所述分类网络输出的所述待识别子图像中的字符；
依据所述字符位置信息排序对应于每一字符位置信息的字符，得到字符识别结果。

2.根据权利要求1所述的方法，其特征在于，所述将所述待识别图像作为已训练的目标检测网络的输入，获得所述目标检测网络输出的所述待识别图像中的字符位置信息，包括：
将所述待识别图像作为所述目标检测网络的输入，通过所述目标检测网络将所述待识别图像划分为多个单元格、对每一单元格计算得到边界框预测结果；其中，所述边界框预测结果包括中心点相对坐标、边界框置信度；
筛选所述边界框置信度大于第一阈值的边界框预测结果，作为边界框识别结果；
基于所述边界框识别结果对应单元格的位置信息，将所述边界框识别结果中的中心点相对坐标调整为中心点坐标，得到所述字符位置信息。

3.根据权利要求1所述的方法，其特征在于，所述目标检测网络，通过如下方式训练得到：
将第一训练集中第一样本图像作为深度学习网络的输入，获得所述第一样本图像中的字符位置预测结果；其中，所述第一样本图像携带字符位置标签；
通过所述字符位置预测结果和所述字符位置标签计算置信度评分；
依据所述字符位置预测结果和所述字符位置标签之间的差异，以及所述置信度评分，调整所述深度学习网络的网络参数；
重复上述过程，直至所述深度学习网络收敛，得到所述目标检测网络。

4.根据权利要求1所述的方法，其特征在于，所述从所述待识别图像裁切与所述字符位置信息对应的待识别子图像，包括：
基于所述字符位置信息、预设裁切宽度和预设裁切高度，对所述待识别图像进行裁切，得到待识别子图像。

5.根据权...

【专利技术属性】
技术研发人员：张耀营，鄢丽萍，高文强，马祥，徐众，孟小路，
申请(专利权)人：苏州杰锐思智能科技股份有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人