一种文本识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34692697 阅读:14 留言:0更新日期:2022-08-27 16:27
本公开实施例提供了一种文本识别方法、装置、电子设备及存储介质,获取待检测图像,并对待检测图像进行文本检测,得到待检测图像中包含待检测文本的初始图像;确定初始图像的指定曲形边界的中点与指定曲形边界所在的圆的圆心之间的目标线段;基于目标线段在目标坐标系中所在的坐标象限,确定初始图像对应的旋转方向和旋转角度;按照旋转方向和旋转角度,对初始图像进行旋转得到待处理图像;对待处理图像进行扭曲矫正得到待识别图像;基于文本识别算法对待识别图像进行文本识别,得到待检测文本的文本内容。基于此,可以提高针对环形文本进行文本识别的准确度。行文本识别的准确度。行文本识别的准确度。

【技术实现步骤摘要】
一种文本识别方法、装置、电子设备及存储介质


[0001]本公开涉及图像处理
,特别是涉及一种文本识别方法、装置、电子设备及存储介质。

技术介绍

[0002]相关技术中,在对图像中的文本进行识别时,通常先确定图像中存在文本的区域,该文本所在区域的图像可以称为目标图像。然后,基于文本识别算法,例如,OCR(Optical Character Recognition,光学字符识别)算法,对目标图像进行文本识别,得到文本内容。
[0003]通常场景下,图像中的文本包含的字符一般为正向分布,即该文本中的字符按照从上到下,从左到右的顺序排列,符合人们的读写标准。由于正向分布的文本的样本量大,可以对文本识别算法进行充足的训练,所以基于文本识别算法对正向分布的文本进行文本识别的效果较好。
[0004]然而,环形文本中的字符呈环形分布,不符合正向分布,例如,针对钢卷、轮毂等物体,其圆截面中的文本为环形文本,由于钢卷、轮毂等物体摆放无规则,导致环形文本中的字符的倾斜角度不确定,基于文本识别算法对环形文本进行文本识别的效果较差。即相关技术中,针对环形文本进行文本识别的准确度较低。

技术实现思路

[0005]本公开实施例的目的在于提供一种文本识别方法、装置、电子设备及存储介质,以提高针对环形文本进行文本识别的准确度。具体技术方案如下:
[0006]第一方面,为了达到上述目的,本公开实施例提供了一种文本识别方法,所述方法包括:
[0007]获取待检测图像,并对所述待检测图像进行文本检测,得到所述待检测图像中包含待检测文本的图像区域,作为初始图像;
[0008]确定所述初始图像的指定曲形边界的中点与所述指定曲形边界所在的圆的圆心之间的线段,作为目标线段;
[0009]基于所述目标线段在目标坐标系中所在的坐标象限,确定所述初始图像对应的旋转方向和旋转角度;其中,所述目标坐标系的原点为所述指定曲形边界所在的圆的圆心;所述目标坐标系的横坐标轴为水平方向;所述目标坐标系的纵坐标轴为竖直方向;
[0010]按照所述旋转方向和所述旋转角度,对所述初始图像进行旋转,得到待处理图像;
[0011]对所述待处理图像进行扭曲矫正,得到待识别图像;
[0012]基于文本识别算法对所述待识别图像进行文本识别,得到所述待检测文本的文本内容。
[0013]在一些实施例中,所述基于所述目标线段在目标坐标系中所在的坐标象限,确定所述初始图像对应的旋转方向和旋转角度,包括:
[0014]在预设的坐标象限与旋转方向的第一对应关系中,确定所述目标线段在目标坐标
系中所在的坐标象限对应的旋转方向,作为所述初始图像对应的旋转方向;其中,所述第一对应关系包括:第一象限、第四象限对应的旋转方向为逆时针旋转;第二象限、第三象限对应的旋转方向为顺时针旋转;
[0015]基于所述目标线段在目标坐标系中所在的坐标象限,以及所述目标线段与所述目标坐标系的横坐标轴之间的锐角夹角,确定所述初始图像对应的旋转角度。
[0016]在一些实施例中,在所述基于所述目标线段在目标坐标系中所在的坐标象限,以及所述目标线段与所述目标坐标系的横坐标轴之间的锐角夹角,确定所述初始图像对应的旋转角度之前,所述方法还包括:
[0017]基于所述初始图像的指定曲形边界的中点在所述目标坐标系中的坐标,计算所述目标线段与所述目标坐标系的横坐标轴之间的锐角夹角;
[0018]所述基于所述目标线段在目标坐标系中所在的坐标象限,以及所述目标线段与所述目标坐标系的横坐标轴之间的锐角夹角,确定所述初始图像对应的旋转角度,包括:
[0019]在预设的坐标象限与旋转角度的第二对应关系中,确定所述目标线段在目标坐标系中所在的坐标象限对应的旋转角度,作为所述初始图像对应的旋转角度;其中,所述第二对应关系包括:第一象限、第二象限对应的旋转角度为:预设角度与所述锐角夹角的差值;第三象限、第四象限对应的旋转角度为:预设角度与所述锐角夹角的和值。
[0020]在一些实施例中,在所述确定所述初始图像的指定曲形边界的中点与所述指定曲形边界所在的圆的圆心之间的线段,作为目标线段之前,所述方法还包括:
[0021]获取所述初始图像的指定曲形边界中的指定点的坐标;
[0022]基于所述指定点的坐标和最小二乘法,对所述指定曲形边界进行圆曲线拟合,得到所述指定曲形边界所在的圆的圆心。
[0023]在一些实施例中,所述对所述待处理图像进行扭曲矫正,得到待识别图像,包括:
[0024]基于所述待处理图像中的各顶点在所述待处理图像中的坐标,以及预设图像区域的顶点在所述预设图像区域中的坐标,计算所述待处理图像与所述预设图像区域之间的映射矩阵;
[0025]针对所述待处理图像中的每一像素点,基于所述映射矩阵和该像素点在所述待处理图像中的坐标,计算该像素点在所述预设图像区域中的对应的像素坐标;
[0026]将该像素点的像素值,作为对应的像素坐标的像素值,得到待识别图像。
[0027]第二方面,为了达到上述目的,本公开实施例提供了一种文本识别装置,所述装置包括:
[0028]检测模块,用于获取待检测图像,并对所述待检测图像进行文本检测,得到所述待检测图像中包含待检测文本的图像区域,作为初始图像;
[0029]第一确定模块,用于确定所述初始图像的指定曲形边界的中点与所述指定曲形边界所在的圆的圆心之间的线段,作为目标线段;
[0030]第二确定模块,用于基于所述目标线段在目标坐标系中所在的坐标象限,确定所述初始图像对应的旋转方向和旋转角度;其中,所述目标坐标系的原点为所述指定曲形边界所在的圆的圆心;所述目标坐标系的横坐标轴为水平方向;所述目标坐标系的纵坐标轴为竖直方向;
[0031]旋转模块,用于按照所述旋转方向和所述旋转角度,对所述初始图像进行旋转,得
到待处理图像;
[0032]矫正模块,用于对所述待处理图像进行扭曲矫正,得到待识别图像;
[0033]识别模块,用于基于文本识别算法对所述待识别图像进行文本识别,得到所述待检测文本的文本内容。
[0034]在一些实施例中,所述第二确定模块,具体用于在预设的坐标象限与旋转方向的第一对应关系中,确定所述目标线段在目标坐标系中所在的坐标象限对应的旋转方向,作为所述初始图像对应的旋转方向;其中,所述第一对应关系包括:第一象限、第四象限对应的旋转方向为逆时针旋转;第二象限、第三象限对应的旋转方向为顺时针旋转;
[0035]基于所述目标线段在目标坐标系中所在的坐标象限,以及所述目标线段与所述目标坐标系的横坐标轴之间的锐角夹角,确定所述初始图像对应的旋转角度。
[0036]在一些实施例中,所述装置还包括:
[0037]第三确定模块,用于在所述第二确定模块执行基于所述目标线段在目标坐标系中所在的坐标象限,以及所述目标线段与所述目标坐标系的横坐标轴之间的锐角夹角,确定所述初始图像对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,所述方法包括:获取待检测图像,并对所述待检测图像进行文本检测,得到所述待检测图像中包含待检测文本的图像区域,作为初始图像;确定所述初始图像的指定曲形边界的中点与所述指定曲形边界所在的圆的圆心之间的线段,作为目标线段;基于所述目标线段在目标坐标系中所在的坐标象限,确定所述初始图像对应的旋转方向和旋转角度;其中,所述目标坐标系的原点为所述指定曲形边界所在的圆的圆心;所述目标坐标系的横坐标轴为水平方向;所述目标坐标系的纵坐标轴为竖直方向;按照所述旋转方向和所述旋转角度,对所述初始图像进行旋转,得到待处理图像;对所述待处理图像进行扭曲矫正,得到待识别图像;基于文本识别算法对所述待识别图像进行文本识别,得到所述待检测文本的文本内容。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标线段在目标坐标系中所在的坐标象限,确定所述初始图像对应的旋转方向和旋转角度,包括:在预设的坐标象限与旋转方向的第一对应关系中,确定所述目标线段在目标坐标系中所在的坐标象限对应的旋转方向,作为所述初始图像对应的旋转方向;其中,所述第一对应关系包括:第一象限、第四象限对应的旋转方向为逆时针旋转;第二象限、第三象限对应的旋转方向为顺时针旋转;基于所述目标线段在目标坐标系中所在的坐标象限,以及所述目标线段与所述目标坐标系的横坐标轴之间的锐角夹角,确定所述初始图像对应的旋转角度。3.根据权利要求2所述的方法,其特征在于,在所述基于所述目标线段在目标坐标系中所在的坐标象限,以及所述目标线段与所述目标坐标系的横坐标轴之间的锐角夹角,确定所述初始图像对应的旋转角度之前,所述方法还包括:基于所述初始图像的指定曲形边界的中点在所述目标坐标系中的坐标,计算所述目标线段与所述目标坐标系的横坐标轴之间的锐角夹角;所述基于所述目标线段在目标坐标系中所在的坐标象限,以及所述目标线段与所述目标坐标系的横坐标轴之间的锐角夹角,确定所述初始图像对应的旋转角度,包括:在预设的坐标象限与旋转角度的第二对应关系中,确定所述目标线段在目标坐标系中所在的坐标象限对应的旋转角度,作为所述初始图像对应的旋转角度;其中,所述第二对应关系包括:第一象限、第二象限对应的旋转角度为:预设角度与所述锐角夹角的差值;第三象限、第四象限对应的旋转角度为:预设角度与所述锐角夹角的和值。4.根据权利要求1所述的方法,其特征在于,在所述确定所述初始图像的指定曲形边界的中点与所述指定曲形边界所在的圆的圆心之间的线段,作为目标线段之前,所述方法还包括:获取所述初始图像的指定曲形边界中的指定点的坐标;基于所述指定点的坐标和最小二乘法,对所述指定曲形边界进行圆曲线拟合,得到所述指定曲形边界所在的圆的圆心。5.根据权利要求1所述的方法,其特征在于,所述对所述待处理图像进行扭曲矫正,得到待识别图像,包括:
基于所述待处理图像中的各顶点在所述待处理图像中的坐标,以及预设图像区域的顶点在所述预设图像区域中的坐标,计算所述待处理图像与所述预设图像区域之间的映射矩阵;针对所述待处理图像中的每一像素点,基于所述映射矩阵和该像素点在所述待处理图像中的坐标,计算该像素点在所述预设图像区域中的对应的像素坐标;将该像素点的像素值,作为对应的像素坐标的像素值,得到待识别图像。6.一种文本识别装置,其特征在于,所述装置包括:检测模块,用于获取待检测图像,并对所述待检测图像进行文本检测,得到所述待检测图像中包含待检测文本的图像区域,作为初始图像;第一确定模块,用于确定所述初始图像的...

【专利技术属性】
技术研发人员:王家霈
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1