字符识别方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：33765567 阅读：15 留言：0更新日期：2022-06-12 14:16

本申请实施例提供了一种字符识别方法、装置、电子设备及计算机可读存储介质，涉及计算机技术领域。该方法包括：获取对待识别图像进行第一字符识别的第一识别结果，以及第一识别结果的第一置信度值；其中，第一字符识别包括对印刷体文本以及手写体文本中的至少一种进行识别；然后获取对第二识别结果进行第二字符识别的第三识别结果，以及第三识别结果的第二置信度值；进而确定待识别图像中的文本内容。本申请实施例实现了直接对包含印刷体文本和手写体文本的图像进行混合识别，无需在识别之前进行图像分类，并且基于置信度值对混合识别后的图像做进一步识别，提高了对图像中的字符进行识别的准确率。进行识别的准确率。进行识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
字符识别方法、装置、电子设备及计算机可读存储介质

[0001]本申请涉及计算机
，具体而言，本申请涉及一种字符识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]由于企业文档数字化需要提取文档中的文字信息，OCR(Optical Character Recognition，光学字符识别)技术已经成为了企业文档数字化的首选。OCR技术可以检测出图像文档中的字符位置并识别字符，但真实文档中往往混杂着印刷体、手写体、印章等多种字体，识别较为困难。
[0003]因此，出现了基于神经网络进行字符识别的方式。例如，采用神经网络对图像文档中的字符进行识别时，首先使用检测模型获取关键文本边框位置，截取文本区域，接着使用神经网络分类器对文本区域进行分类，即区分出多种字符类型，最后根据文本区域的字符类型，使用不同的识别模型进行字符识别。
[0004]然而，神经网络分类器在对多种字体进行分类时可能会出现错误，导致在后续识别中继续使用预测错误的识别模型来识别字符；并且，由于识别模型的训练集类型不平衡，容易出现识别结果不准确的问题；例如，训练集中存在大量印刷体样本时，则在后续识别时，分类器更容易识别印刷体，从而干扰输出。

技术实现思路

[0005]本申请实施例的目的旨在能解决对包含多种字体的图像进行字符识别时，准确率较低的问题。
[0006]根据本申请实施例的一个方面，提供了一种字符识别方法，该方法包括：
[0007]获取对待识别图像进行第一字符识别的第一识别结果，以及第...

【技术保护点】

【技术特征摘要】
1.一种字符识别方法，其特征在于，包括：获取对待识别图像进行第一字符识别的第一识别结果，以及所述第一识别结果的第一置信度值；其中，所述第一字符识别包括对印刷体文本以及手写体文本中的至少一种进行识别；获取对第二识别结果进行第二字符识别的第三识别结果，以及所述第三识别结果的第二置信度值；其中，所述第二识别结果包括所述第一置信度值低于预设阈值的所述第一识别结果；所述第二字符识别包括对所述手写体文本进行识别；根据所述第一识别结果、所述第一置信度值、所述第三识别结果和所述第三置信度值，确定所述待识别图像中的文本内容。2.根据权利要求1所述的字符识别方法，其特征在于，所述获取对待识别图像进行第一字符识别的第一识别结果，以及所述第一识别结果的第一置信度值，包括：将所述待识别图像输入至第一处理器，根据所述第一处理器对所述待识别图像进行第一字符识别，获取第一识别结果和所述第一识别结果的第一置信度值；所述获取对第二识别结果进行第二字符识别的第三识别结果，以及所述第三识别结果的第二置信度值，包括：将所述第二识别结果对应的待识别图像输入至第二处理器，根据所述第二处理器进行第二字符识别，获取第三识别结果和所述第三识别结果的第二置信度值。3.根据权利要求1所述的字符识别方法，其特征在于，所述获取对第二识别结果进行第二字符识别的第三识别结果，以及所述第三识别结果的第二置信度值之后，所述方法还包括：将所述第三识别结果与预设字符库中的字符串进行匹配，筛选出相匹配的所述第二置信度值最大的所述第三识别结果。4.根据权利要求1所述的字符识别方法，其特征在于，所述获取对待识别图像进行第一字符识别的第一识别结果，以及所述第一识别结果的第一置信度值之前，所述方法包括：将待识别图像缩放为预设尺寸，并对缩放后的待识别图像的RGB值进行归一化处理；将归一化处理后的待识别图像转换为灰度图像，并进行高斯模糊处理和二值化处理。5.根据权利要求4所述的字符识别方法，其特征在于，所述获取对待识别图像进行第一字符识别的第一识别结果，以及所述第一识别结果的第一置信度值之前，所述方法还包括：获取所述待识别图像中的文本块...

【专利技术属性】
技术研发人员：杨爱东，王静远，宋勇，叶晓舟，欧阳晔，
申请(专利权)人：亚信科技中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人