字符识别方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:33765567 阅读:15 留言:0更新日期:2022-06-12 14:16
本申请实施例提供了一种字符识别方法、装置、电子设备及计算机可读存储介质,涉及计算机技术领域。该方法包括:获取对待识别图像进行第一字符识别的第一识别结果,以及第一识别结果的第一置信度值;其中,第一字符识别包括对印刷体文本以及手写体文本中的至少一种进行识别;然后获取对第二识别结果进行第二字符识别的第三识别结果,以及第三识别结果的第二置信度值;进而确定待识别图像中的文本内容。本申请实施例实现了直接对包含印刷体文本和手写体文本的图像进行混合识别,无需在识别之前进行图像分类,并且基于置信度值对混合识别后的图像做进一步识别,提高了对图像中的字符进行识别的准确率。进行识别的准确率。进行识别的准确率。

【技术实现步骤摘要】
字符识别方法、装置、电子设备及计算机可读存储介质


[0001]本申请涉及计算机
,具体而言,本申请涉及一种字符识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]由于企业文档数字化需要提取文档中的文字信息,OCR(Optical Character Recognition,光学字符识别)技术已经成为了企业文档数字化的首选。OCR技术可以检测出图像文档中的字符位置并识别字符,但真实文档中往往混杂着印刷体、手写体、印章等多种字体,识别较为困难。
[0003]因此,出现了基于神经网络进行字符识别的方式。例如,采用神经网络对图像文档中的字符进行识别时,首先使用检测模型获取关键文本边框位置,截取文本区域,接着使用神经网络分类器对文本区域进行分类,即区分出多种字符类型,最后根据文本区域的字符类型,使用不同的识别模型进行字符识别。
[0004]然而,神经网络分类器在对多种字体进行分类时可能会出现错误,导致在后续识别中继续使用预测错误的识别模型来识别字符;并且,由于识别模型的训练集类型不平衡,容易出现识别结果不准确的问题;例如,训练集中存在大量印刷体样本时,则在后续识别时,分类器更容易识别印刷体,从而干扰输出。

技术实现思路

[0005]本申请实施例的目的旨在能解决对包含多种字体的图像进行字符识别时,准确率较低的问题。
[0006]根据本申请实施例的一个方面,提供了一种字符识别方法,该方法包括:
[0007]获取对待识别图像进行第一字符识别的第一识别结果,以及第一识别结果的第一置信度值;其中,第一字符识别包括对印刷体文本以及手写体文本中的至少一种进行识别;
[0008]获取对第二识别结果进行第二字符识别的第三识别结果,以及第三识别结果的第二置信度值;其中,第二识别结果包括第一置信度值低于预设阈值的第一识别结果;第二字符识别包括对手写体文本进行识别;
[0009]根据第一识别结果、第一置信度值、第三识别结果和第三置信度值,确定待识别图像中的文本内容。
[0010]可选地,获取对待识别图像进行第一字符识别的第一识别结果,以及第一识别结果的第一置信度值,包括:
[0011]将待识别图像输入至第一处理器,根据第一处理器对待识别图像进行第一字符识别,获取第一识别结果和第一识别结果的第一置信度值;
[0012]获取对第二识别结果进行第二字符识别的第三识别结果,以及第三识别结果的第二置信度值,包括:
[0013]将第二识别结果对应的待识别图像输入至第二处理器,根据第二处理器进行第二
字符识别,获取第三识别结果和第三识别结果的第二置信度值。
[0014]可选地,获取对第二识别结果进行第二字符识别的第三识别结果,以及第三识别结果的第二置信度值之后,方法还包括:
[0015]将第三识别结果与预设字符库中的字符串进行匹配,筛选出相匹配的第二置信度值最大的第三识别结果。
[0016]可选地,获取对待识别图像进行第一字符识别的第一识别结果,以及第一识别结果的第一置信度值之前,方法包括:
[0017]将待识别图像缩放为预设尺寸,并对缩放后的待识别图像的RGB值进行归一化处理;
[0018]将归一化处理后的待识别图像转换为灰度图像,并进行高斯模糊处理和二值化处理。
[0019]可选地,获取对待识别图像进行第一字符识别的第一识别结果,以及第一识别结果的第一置信度值之前,方法还包括:
[0020]获取待识别图像中的文本块,将文本块旋转至水平方向;其中,文本块为包括印刷体文本以及手写体文本中的至少一种的矩形图像。
[0021]可选地,将第二识别结果对应的待识别图像输入至第二处理器,根据第二处理器进行第二字符识别,包括:
[0022]根据文本块的长度与宽度的比值确定文本块中的字符的个数,通过高斯平滑极值连通域法将文本块中的字符串切分为字符进行第二字符识别。
[0023]可选地,获取对待识别图像进行第一字符识别的第一识别结果,以及第一识别结果的第一置信度值之前,方法还包括:
[0024]获取训练样本集;训练样本集包括印刷体文本和手写体文本;
[0025]将训练样本集输入至初始处理器,得到初始识别结果和对应的初始置信度值;
[0026]根据初始识别结果和初始置信度值对初始处理器进行反向优化,得到优化后的处理器,直至得到满足预设精确度要求的第一处理器。
[0027]根据本申请实施例的另一个方面,提供了一种字符识别装置,该装置包括:
[0028]第一识别模块,用于获取对待识别图像进行第一字符识别的第一识别结果,以及第一识别结果的第一置信度值;其中,第一字符识别包括对印刷体文本以及手写体文本中的至少一种进行识别;
[0029]第二识别模块,用于获取对第二识别结果进行第二字符识别的第三识别结果,以及第三识别结果的第二置信度值;其中,第二识别结果包括第一置信度值低于预设阈值的第一识别结果;第二字符识别包括对手写体文本进行识别;
[0030]确定模块,用于根据第一识别结果、第一置信度值、第三识别结果和第三置信度值,确定待识别图像中的文本内容。
[0031]可选地,第一识别模块具体用于:
[0032]将待识别图像输入至第一处理器,根据第一处理器对待识别图像进行第一字符识别,获取第一识别结果和第一识别结果的第一置信度值;
[0033]第二识别模块具体用于:
[0034]将第二识别结果对应的待识别图像输入至第二处理器,根据第二处理器进行第二
字符识别,获取第三识别结果和第三识别结果的第二置信度值。
[0035]可选地,装置还包括:
[0036]筛选模块,用于将第三识别结果与预设字符库中的字符串进行匹配,筛选出相匹配的第二置信度值最大的第三识别结果。
[0037]可选地,装置包括:
[0038]第一预处理模块,用于将待识别图像缩放为预设尺寸,并对缩放后的待识别图像的RGB值进行归一化处理;
[0039]第二预处理模块,用于将归一化处理后的待识别图像转换为灰度图像,并进行高斯模糊处理和二值化处理。
[0040]可选地,装置还包括:
[0041]第三预处理模块,用于获取待识别图像中的文本块,将文本块旋转至水平方向;其中,文本块为包括印刷体文本以及手写体文本中的至少一种的矩形图像。
[0042]可选地,第二识别模块包括:
[0043]切分模块,用于根据文本块的长度与宽度的比值确定文本块中的字符的个数,通过高斯平滑极值连通域法将文本块中的字符串切分为字符进行第二字符识别。
[0044]可选地,装置还包括训练模块;训练模块具体用于:
[0045]获取训练样本集;训练样本集包括印刷体文本和手写体文本;
[0046]将训练样本集输入至初始处理器,得到初始识别结果和对应的初始置信度值;
[0047]根据初始识别结果和初始置信度值对初始处理器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:获取对待识别图像进行第一字符识别的第一识别结果,以及所述第一识别结果的第一置信度值;其中,所述第一字符识别包括对印刷体文本以及手写体文本中的至少一种进行识别;获取对第二识别结果进行第二字符识别的第三识别结果,以及所述第三识别结果的第二置信度值;其中,所述第二识别结果包括所述第一置信度值低于预设阈值的所述第一识别结果;所述第二字符识别包括对所述手写体文本进行识别;根据所述第一识别结果、所述第一置信度值、所述第三识别结果和所述第三置信度值,确定所述待识别图像中的文本内容。2.根据权利要求1所述的字符识别方法,其特征在于,所述获取对待识别图像进行第一字符识别的第一识别结果,以及所述第一识别结果的第一置信度值,包括:将所述待识别图像输入至第一处理器,根据所述第一处理器对所述待识别图像进行第一字符识别,获取第一识别结果和所述第一识别结果的第一置信度值;所述获取对第二识别结果进行第二字符识别的第三识别结果,以及所述第三识别结果的第二置信度值,包括:将所述第二识别结果对应的待识别图像输入至第二处理器,根据所述第二处理器进行第二字符识别,获取第三识别结果和所述第三识别结果的第二置信度值。3.根据权利要求1所述的字符识别方法,其特征在于,所述获取对第二识别结果进行第二字符识别的第三识别结果,以及所述第三识别结果的第二置信度值之后,所述方法还包括:将所述第三识别结果与预设字符库中的字符串进行匹配,筛选出相匹配的所述第二置信度值最大的所述第三识别结果。4.根据权利要求1所述的字符识别方法,其特征在于,所述获取对待识别图像进行第一字符识别的第一识别结果,以及所述第一识别结果的第一置信度值之前,所述方法包括:将待识别图像缩放为预设尺寸,并对缩放后的待识别图像的RGB值进行归一化处理;将归一化处理后的待识别图像转换为灰度图像,并进行高斯模糊处理和二值化处理。5.根据权利要求4所述的字符识别方法,其特征在于,所述获取对待识别图像进行第一字符识别的第一识别结果,以及所述第一识别结果的第一置信度值之前,所述方法还包括:获取所述待识别图像中的文本块...

【专利技术属性】
技术研发人员:杨爱东王静远宋勇叶晓舟欧阳晔
申请(专利权)人:亚信科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1