文字检测识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:31839042 阅读:17 留言:0更新日期:2022-01-12 13:18
本申请提供了一种文字检测识别方法、装置、电子设备及存储介质,其中,该方法包括:对原始图像进行印章检测,得到印章区域;采用原始图像的背景颜色的均值对印章区域进行填充,得到待检测图像;对待检测图像进行文字检测,得到待识别文字区域图像;对待识别文字区域图像进行表格框线检测,得到表格框线检测结果;根据表格框线检测结果确定待识别文字区域图像的裁剪位置,以及基于裁剪位置对待识别文字区域图像进行裁剪,得到裁剪后的待识别文字区域图像;基于裁剪后的待识别文字区域图像,得到文字识别结果。本申请实施例有利于提升文字检测和识别的精度。检测和识别的精度。检测和识别的精度。

【技术实现步骤摘要】
文字检测识别方法、装置、电子设备及存储介质


[0001]本申请涉及图像识别
,尤其涉及一种文字检测识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着计算机性能的不断提高,高度依赖中央处理器或图形处理器等计算资源的深度学习技术广泛应用于社会各行各业中,并取得了突出的成果。OCR(Optical Character Recognition,光学字符识别)技术是近年来发展较为成熟的基于深度学习的技术,其是指电子设备检查物件上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。一般情况下,OCR技术能够胜任文字的定位和识别,但是考虑到深度学习中神经网络在实现机制和资源占用等方面的限制,当物件存在干扰、噪声、失真等情况时,文字检测和识别的精度会受到影响。

技术实现思路

[0003]针对上述问题,本申请提供了一种文字检测识别方法、装置、电子设备及存储介质,有利于提升文字检测和识别的精度。
[0004]为实现上述目的,本申请实施例第一方面提供了一种文字检测识别方法,该方法包括:
[0005]对原始图像进行印章检测,得到印章区域;
[0006]采用原始图像的背景颜色的均值对印章区域进行填充,得到待检测图像;
[0007]对待检测图像进行文字检测,得到待识别文字区域图像;
[0008]对待识别文字区域图像进行表格框线检测,得到表格框线检测结果;
[0009]根据表格框线检测结果确定待识别文字区域图像的裁剪位置,以及基于裁剪位置对待识别文字区域图像进行裁剪,得到裁剪后的待识别文字区域图像;
[0010]基于裁剪后的待识别文字区域图像,得到文字识别结果。
[0011]结合第一方面,在一种可能的实施方式中,对原始图像进行印章检测,得到印章区域,包括:
[0012]将原始图像转换为第一二值图像;
[0013]根据第一二值图像确定原始图像中的圆形轮廓;
[0014]根据原始图像确定圆形轮廓的色调;
[0015]根据圆形轮廓的色调,得到印章区域。
[0016]结合第一方面,在一种可能的实施方式中,根据第一二值图像确定原始图像中的圆形轮廓,包括:
[0017]根据第一二值图像确定出原始图像中的轮廓;
[0018]计算轮廓围成图形的面积与轮廓的最小外接圆的面积之比,得到原始图像中多个轮廓的面积比;
[0019]将多个轮廓的面积比与预设的面积阈值进行比对,并将面积比大于或等于预设的面积阈值的轮廓确定为圆形轮廓。
[0020]结合第一方面,在一种可能的实施方式中,对待识别文字区域图像进行表格框线检测,得到表格框线检测结果,包括:
[0021]将待识别文字区域图像转换为第二二值图像;
[0022]沿高度方向遍历第二二值图像的每列像素,对每列像素进行求和;
[0023]将每列像素的求和结果作为元素存入列表,得到长为w的第一列表,w为大于1的整数;
[0024]沿宽度方向遍历第二二值图像的每行像素,对每行像素进行求和;
[0025]将每行像素的求和结果作为元素存入列表,得到长为h的第二列表,h为大于1的整数;
[0026]根据第一列表和第二列表,得到表格框线检测结果。
[0027]结合第一方面,在一种可能的实施方式中,表格框线检测结果包括存在竖向表格框线、存在横向表格框线和不存在表格框线;根据第一列表和第二列表,得到表格框线检测结果,包括:
[0028]计算第一列表中每个位置上的求和结果与相邻位置上的求和结果的第一差值,若第一差值中存在大于或等于第一预设值的目标第一差值,则确定表格框线检测结果为存在竖向表格框线;
[0029]计算第二列表中每个位置上的求和结果与相邻位置上的求和结果的第二差值,若第二差值中存在大于或等于第二预设值的目标第二差值,则确定表格框线检测结果为存在横向表格框线;
[0030]若第一差值中不存在目标第一差值且第二差值中不存在目标第二差值,则确定表格框线检测结果为不存在表格框线。
[0031]结合第一方面,在一种可能的实施方式中,根据表格框线检测结果确定待识别文字区域图像的裁剪位置,包括:
[0032]在表格框线检测结果为存在竖向表格框线和/或存在横向表格框线的情况下,根据竖向表格框线所在的列和/或横向表格框线所在的行确定裁剪位置;
[0033]在表格框线检测结果为不存在表格框线的情况下,根据第一列表和第二列表中首尾连续的0元素确定裁剪位置。
[0034]本申请实施例第二方面提供了一种文字检测识别装置,该装置包括检测单元和识别单元;其中,
[0035]检测单元,用于对原始图像进行印章检测,得到印章区域;
[0036]识别单元,用于采用原始图像的背景颜色的均值对印章区域进行填充,得到待检测图像;
[0037]检测单元,还用于对待检测图像进行文字检测,得到待识别文字区域图像;
[0038]检测单元,还用于对待识别文字区域图像进行表格框线检测,得到表格框线检测结果;
[0039]识别单元,还用于根据表格框线检测结果确定待识别文字区域图像的裁剪位置,以及基于裁剪位置对待识别文字区域图像进行裁剪,得到裁剪后的待识别文字区域图像;
[0040]识别单元,还用于基于裁剪后的待识别文字区域图像,得到文字识别结果。
[0041]本申请实施例第三方面提供了一种电子设备,该电子设备包括输入设备和输出设备,还包括处理器,适于实现一条或多条指令;以及,存储器,所述存储器存储有一条或多条计算机程序,所述一条或多条计算机程序适于由所述处理器加载并执行如下步骤:
[0042]对原始图像进行印章检测,得到印章区域;
[0043]采用原始图像的背景颜色的均值对印章区域进行填充,得到待检测图像;
[0044]对待检测图像进行文字检测,得到待识别文字区域图像;
[0045]对待识别文字区域图像进行表格框线检测,得到表格框线检测结果;
[0046]根据表格框线检测结果确定待识别文字区域图像的裁剪位置,以及基于裁剪位置对待识别文字区域图像进行裁剪,得到裁剪后的待识别文字区域图像;
[0047]基于裁剪后的待识别文字区域图像,得到文字识别结果。
[0048]本申请实施例第四方面提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如下步骤:
[0049]对原始图像进行印章检测,得到印章区域;
[0050]采用原始图像的背景颜色的均值对印章区域进行填充,得到待检测图像;
[0051]对待检测图像进行文字检测,得到待识别文字区域图像;
[0052]对待识别文字区域图像进行表格框线检测,得到表格框线检测结果;
[0053]根据表格框线检测结果确定待识别文字区域图像的裁剪位置,以及基于裁剪位置对待识别文字区本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字检测识别方法,其特征在于,所述方法包括:对原始图像进行印章检测,得到印章区域;采用所述原始图像的背景颜色的均值对所述印章区域进行填充,得到待检测图像;对所述待检测图像进行文字检测,得到待识别文字区域图像;对所述待识别文字区域图像进行表格框线检测,得到表格框线检测结果;根据所述表格框线检测结果确定所述待识别文字区域图像的裁剪位置,以及基于所述裁剪位置对所述待识别文字区域图像进行裁剪,得到裁剪后的待识别文字区域图像;基于所述裁剪后的待识别文字区域图像,得到文字识别结果。2.根据权利要求1所述的方法,其特征在于,所述对原始图像进行印章检测,得到印章区域,包括:将所述原始图像转换为第一二值图像;根据所述第一二值图像确定所述原始图像中的圆形轮廓;根据所述原始图像确定所述圆形轮廓的色调;根据所述圆形轮廓的色调,得到所述印章区域。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一二值图像确定所述原始图像中的圆形轮廓,包括:根据所述第一二值图像确定出所述原始图像中的轮廓;计算所述轮廓围成图形的面积与所述轮廓的最小外接圆的面积之比,得到所述原始图像中多个轮廓的面积比;将所述多个轮廓的面积比与预设的面积阈值进行比对,并将面积比大于或等于预设的面积阈值的轮廓确定为所述圆形轮廓。4.根据权利要求3所述的方法,其特征在于,所述对所述待识别文字区域图像进行表格框线检测,得到表格框线检测结果,包括:将所述待识别文字区域图像转换为第二二值图像;沿高度方向遍历所述第二二值图像的每列像素,对所述每列像素进行求和;将所述每列像素的求和结果作为元素存入列表,得到长为w的第一列表,w为大于1的整数;沿宽度方向遍历所述第二二值图像的每行像素,对所述每行像素进行求和;将所述每行像素的求和结果作为元素存入列表,得到长为h的第二列表,h为大于1的整数;根据所述第一列表和所述第二列表,得到所述表格框线检测结果。5.根据权利要求3所述的方法,其特征在于,所述表格框线检测结果包括存在竖向表格框线、存在横向表格框线和不存在表格框线;所述根据所述第一列表和所述第二列表,得到所述表格框线检测结果,包括:计算所述第一列表中每个位置上的求和结果与相邻位置上的求和结果的第一差值,若所述第一差值中存在大于或等于第一预设值的目标第一差值,则确定所述表格框线检测结果为存在竖向表格框线;计算所述第二列表中每个位置上的求和结果与相邻位置上的求和结果的第二差值,若所述第二差值中存在大于或等于第二预设值的目标第二差值,则确定所述表格框线...

【专利技术属性】
技术研发人员:侯丽
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1