文字识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:38343118 阅读:9 留言:0更新日期:2023-08-02 09:23
本申请提供一种文字识别方法、装置、电子设备及可读存储介质,其中,所述文字识别方法包括:获取待识别图像;确定所述待识别图像中的文字连通区域;在所述文字连通区域内的字符排列满足所述预设条件的情况下,对所述文字连通区域进行基于文本行的文字识别,得到所述文字连通区域中的文本信息;在所述文字连通区域内的字符排列不满足所述预设条件的情况下,对所述文字连通区域进行基于单字符的文字识别,得到所述文字连通区域中的文本信息。本申请能够提高文字识别的效率和准确性。够提高文字识别的效率和准确性。够提高文字识别的效率和准确性。

【技术实现步骤摘要】
文字识别方法、装置、电子设备及可读存储介质


[0001]本申请实施例涉及文字识别
,尤其涉及一种文字识别方法、装置、电子设备及可读存储介质。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)是指对包含文本信息的图像进行分析识别处理,获取图像中的文本信息的过程。
[0003]OCR技术被应用于各种场景中,待识别的图像也多种多样。目前,通常使用文本行识别方法对图像进行识别。但是,若图像中包含的元素较复杂多样,文字布局不规则,可能无法检测到规则的文本行,使得OCR识别的难度较大,准确性也较低。

技术实现思路

[0004]本申请实施例的目的在于提供一种文字识别方法、装置、电子设备及可读存储介质,解决了现有技术中文字识别准确性较低的问题。
[0005]第一方面,本申请实施例提供一种文字识别方法,包括:
[0006]获取待识别图像;
[0007]确定所述待识别图像中的文字连通区域;
[0008]在所述文字连通区域内的字符排列满足预设条件的情况下,对所述文字连通区域进行基于文本行的文字识别,得到所述文字连通区域中的文本信息;
[0009]在所述文字连通区域内的字符排列不满足所述预设条件的情况下,对所述文字连通区域进行基于单字符的文字识别,得到所述文字连通区域中的文本信息。
[0010]可选地,在确定所述待识别图像中的文字连通区域之后,所述方法还包括:
[0011]确定所述文字连通区域内的字符的位置信息;
[0012]根据所述文字连通区域内的字符的位置信息,确定所述字符对应的目标位置点;
[0013]对所述文字连通区域内的目标位置点进行直线拟合,得到直线拟合误差;
[0014]在所述直线拟合误差满足预设误差条件的情况下,确定所述文字连通区域内的字符排列满足预设条件;
[0015]在所述直线拟合误差不满足所述预设误差条件的情况下,确定所述文字连通区域内的字符排列不满足所述预设条件。
[0016]可选地,所述确定所述文字连通区域内的字符的位置信息,包括:
[0017]基于所述文字连通区域和所述待识别图像中的字符的位置信息,确定所述文字连通区域内的字符的位置信息。
[0018]可选地,在确定所述文字连通区域内的字符的位置信息之前,所述方法还包括::
[0019]提取所述待识别图像对应于第一预设尺度的第一特征图;
[0020]基于所述第一特征图,确定所述待识别图像中的字符的位置信息。
[0021]可选地,所述确定所述待识别图像中的文字连通区域,包括:
[0022]提取所述待识别图像对应于第二预设尺度的第二特征图;
[0023]基于所述第二特征图中每个位置点的特征值,确定所述待识别图像对应的第三特征图;
[0024]对所述第三特征图进行连通区域分析,确定所述待识别图像中的文字连通区域。
[0025]可选地,所述基于所述第二特征图中每个位置点的特征值,确定所述待识别图像对应的第三特征图,包括:
[0026]在所述第二特征图中的第一位置点的特征值满足预设特征条件的情况下,将所述第三特征图中的第二位置点的值确定为第一预设值;
[0027]在所述第二特征图中的第一位置点的特征值不满足所述预设特征条件的情况下,将所述第三特征图中的第二位置点的值确定为第二预设值;
[0028]其中,所述第三特征图中的所述第二位置点与第二特征图中的所述第一位置点对应。
[0029]可选地,所述在所述文字连通区域内的字符排列不满足所述预设条件的情况下,对所述文字连通区域进行基于单字符的文字识别,得到所述文字连通区域中的文本信息,包括:
[0030]在所述文字连通区域内的字符排列不满足所述预设条件的情况下,对所述文字连通区域进行基于单字符的文字识别,得到所述文字连通区域中的文字序列;
[0031]对所述文字序列进行重排序,得到所述文字连通区域中的文本信息。
[0032]可选地,所述待识别图像满足以下至少一项:
[0033]所述待识别图像中的字符的字体包括两种或两种以上;
[0034]所述待识别图像中的字符的尺寸包括两种或两种以上;
[0035]所述待识别图像中的字符的排列方式包括两种或两种以上。
[0036]第二方面,本申请实施例提供一种文字识别装置,包括:
[0037]第一获取模块,用于获取待识别图像;
[0038]第一确定模块,用于确定所述待识别图像中的文字连通区域;
[0039]第一识别模块,用于在所述文字连通区域内的字符排列满足所述预设条件的情况下,对所述文字连通区域进行基于文本行的文字识别,得到所述文字连通区域中的文本信息;
[0040]第二识别模块,用于在所述文字连通区域内的字符排列不满足所述预设条件的情况下,对所述文字连通区域进行基于单字符的文字识别,得到所述文字连通区域中的文本信息。
[0041]可选地,所述装置还包括:
[0042]第二确定模块,用于确定所述文字连通区域内的字符的位置信息;
[0043]第三确定模块,用于根据所述文字连通区域内的字符的位置信息,确定所述字符对应的目标位置点;
[0044]拟合模块,用于对所述文字连通区域内的目标位置点进行直线拟合,得到直线拟合误差;
[0045]第一判断模块,用于在所述直线拟合误差满足预设误差条件的情况下,确定所述文字连通区域内的字符排列满足预设条件;
[0046]第二判断模块,用于在所述直线拟合误差不满足所述预设误差条件的情况下,确定所述文字连通区域内的字符排列不满足所述预设条件。
[0047]可选地,所述第二确定模块,用于:
[0048]基于所述文字连通区域和所述待识别图像中的字符的位置信息,确定所述文字连通区域内的字符的位置信息。
[0049]可选地,所述装置还包括:
[0050]提取模块,用于提取所述待识别图像对应于第一预设尺度的第一特征图;
[0051]第四确定模块,用于基于所述第一特征图,确定所述待识别图像中的字符的位置信息。
[0052]可选地,所述第一确定模块包括:
[0053]提取单元,用于提取所述待识别图像对应于第二预设尺度的第二特征图;
[0054]第一确定单元,用于基于所述第二特征图中每个位置点的特征值,确定所述待识别图像对应的第三特征图;
[0055]分析单元,用于对所述第三特征图进行连通区域分析,确定所述待识别图像中的文字连通区域。
[0056]可选地,所述第一确定单元包括:
[0057]第一确定子单元,用于在所述第二特征图中的第一位置点的特征值满足预设特征条件的情况下,将所述第三特征图中的第二位置点的值确定为第一预设值;
[0058]第二确定子单元,用于在所述第二特征图中的第一位置点的特征值不满足所述预设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:获取待识别图像;确定所述待识别图像中的文字连通区域;在所述文字连通区域内的字符排列满足预设条件的情况下,对所述文字连通区域进行基于文本行的文字识别,得到所述文字连通区域中的文本信息;在所述文字连通区域内的字符排列不满足所述预设条件的情况下,对所述文字连通区域进行基于单字符的文字识别,得到所述文字连通区域中的文本信息。2.根据权利要求1所述的方法,其特征在于,在确定所述待识别图像中的文字连通区域之后,所述方法还包括:确定所述文字连通区域内的字符的位置信息;根据所述文字连通区域内的字符的位置信息,确定所述字符对应的目标位置点;对所述文字连通区域内的目标位置点进行直线拟合,得到直线拟合误差;在所述直线拟合误差满足预设误差条件的情况下,确定所述文字连通区域内的字符排列满足预设条件;在所述直线拟合误差不满足所述预设误差条件的情况下,确定所述文字连通区域内的字符排列不满足所述预设条件。3.根据权利要求2所述的方法,其特征在于,所述确定所述文字连通区域内的字符的位置信息,包括:基于所述文字连通区域和所述待识别图像中的字符的位置信息,确定所述文字连通区域内的字符的位置信息。4.根据权利要求2或3所述的方法,其特征在于,在确定所述文字连通区域内的字符的位置信息之前,所述方法还包括:提取所述待识别图像对应于第一预设尺度的第一特征图;基于所述第一特征图,确定所述待识别图像中的字符的位置信息。5.根据权利要求1

3中任意一项所述的方法,其特征在于,所述确定所述待识别图像中的文字连通区域,包括:提取所述待识别图像对应于第二预设尺度的第二特征图;基于所述第二特征图中每个位置点的特征值,确定所述待识别图像对应的第三特征图;对所述第三特征图进行连通区域分析,确定所述待识别图像中的文字连通区域。6.根据权利要求5所述的方法,其特征在于,所述基于所述第二特征图中每个位置点的特征值,确定所述待识别图像对应的第三特征图,包括:在所述第二特征图中的第一位置点的特征值满足预设特征条件的情况...

【专利技术属性】
技术研发人员:贾千文郑慧冯俊兰邓超
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1