一种基于投影的文本行旋转校正方法及装置制造方法及图纸

技术编号:26764517 阅读:75 留言:0更新日期:2020-12-18 23:40
本申请属于图像识别技术领域,具体涉及一种基于投影的文本行旋转校正方法及装置。目前常用的光学字符识别算法多采用路径搜索、连通域分析等算法直接进行字符分割,易受噪声干扰、出错率较高且效率相对较低。本申请采用投影技术,根据投影曲线的宽高比与文本行倾斜角度的对应关系,能够快速精确定位到文本行方向并计算旋转校正角度,从而获得水平方向的文本行图像,本申请的投影方法高效精确,具有良好的稳定性;通过粗定位和精细定位过程,提高运算速率,提升了算法的准确性;本申请易于实施、算法复杂度低,具有普适性,适于行业内推广应用。

【技术实现步骤摘要】
一种基于投影的文本行旋转校正方法及装置
本申请涉及图像识别
,尤其涉及一种基于投影的文本行旋转校正方法及装置。
技术介绍
在图像识别
,光学字符识别是一种重要的识别技术。光学字符识别是指利用电子设备确定字符形状,然后用字符识别方法将形状翻译成计算机文字的过程,即对文本图像进行扫描,然后对文本行进行分析处理,获取文字字符的过程,主要包括图像获取、预处理、特征提取和字符识别四个环节。然而,在进行光学字符识别时,图像中所包含的文本行方向的不水平会增加单字符分割的难度,同时也会降低字符识别的精度。为了提高文本识别的准确性,对非水平方向的文本行进行光学字符识别,通常先通过图像的旋转校正使图像中所包含的文本行的方向为水平,然后再进行单字符的分割与识别。目前,常用的光学字符识别算法多采用路径搜索、连通域分析等算法直接进行字符分割,易受噪声干扰、出错率较高且效率相对较低。
技术实现思路
本申请提供了一种基于投影的文本行旋转校正方法及装置,以解决目前光学字符识别中存在的精度较差以及效率较低的问题。本申请采用的技术方案如下:本申请的第一方面,提供一种基于投影的文本行旋转校正方法,包括以下步骤:获取待校正文本图像;旋转所述待校正文本图像,沿水平方向对初始状态以及旋转后的所述待校正文本图像进行像素点累积投影,获取各组水平方向投影曲线;根据所述各组水平方向投影曲线,计算各组投影曲线的宽高比;根据所述各组投影曲线的宽高比,将所述各组投影曲线的宽高比最大值所对应的旋转的角度确定为旋转校正角度;将所述待校正文本图像旋转所述旋转校正角度,获得校正后的文本图像。可选的,在所述获取待校正文本图像的步骤之后,还包括:对所述待校正文本图像进行预处理,获得二值化文本图像。可选的,所述对所述待校正文本图像进行预处理,包括:对所述待校正文本图像进行阈值分割,获得二值化文本图像。可选的,在所述对所述待校正文本图像进行预处理,获得二值化文本图像的步骤之后,还包括:对所述二值化文本图像进行降采样处理,获得降采样文本图像。可选的,所述对所述待校正文本图像进行预处理,包括:对所述待校正文本图像进行边缘特征提取或聚类分析处理,获得二值化文本图像。可选的,在所述根据所述投影曲线的宽高比,将所述投影曲线的宽高比最大值所对应的角度确定为旋转校正角度的步骤中,包括:先进行粗定位,然后进行精确定位后确定旋转校正角度;所述粗定位过程包括:先输入角度搜索范围,再计算各个角度下投影曲线的宽高比,从中挑选出宽高比最大值所对应的角度确定为粗定位旋转角度;所述精确定位过程包括:先计算精确定位角度搜索范围,再计算各个角度下投影曲线的宽高比,从中挑选出宽高比最大值所对应的角度确定为精确定位旋转角度;所述精确定位旋转角度即为文本行的旋转校正角度。本申请的第二方面,提供一种基于投影的文本行旋转校正装置,所述装置包括:待校正文本图像获取模块,用于获取待校正文本图像;投影曲线获取模块,用于旋转所述待校正文本图像,沿水平方向对初始状态以及旋转后的所述待校正文本图像进行像素点累积投影,获取各组水平方向投影曲线;投影曲线计算模块,用于根据所述各组水平方向投影曲线,计算各组投影曲线的宽高比;旋转校正角度确定模块,用于根据所述各组投影曲线的宽高比,将所述各组投影曲线的宽高比最大值所对应的旋转的角度确定为旋转校正角度;文本图像校正模块,用于将所述待校正文本图像旋转所述旋转校正角度,获得校正后的文本图像。可选的,所述待校正文本图像获取模块中,还包括二值化子模块和降采样子模块,所述二值化子模块用于对所述待校正文本图像进行阈值分割,获得二值化文本图像,所述降采样子模块用于对所述二值化文本图像进行降采样处理,获得降采样文本图像。可选的,所述待校正文本图像获取模块中,还包括预处理子模块,所述预处理子模块用于对所述待校正文本图像进行边缘特征提取或聚类分析处理,获得二值化文本图像。可选的,所述旋转校正角度确定模块中包括粗定位子模块和精确定位子模块;所述粗定位子模块用于先输入角度搜索范围,再计算各个角度下投影曲线的宽高比,从中挑选出宽高比最大值所对应的角度确定为粗定位旋转角度;所述精确定位子模块用于先计算精确定位角度搜索范围,再计算各个角度下投影曲线的宽高比,从中挑选出宽高比最大值所对应的角度确定为精确定位旋转角度,所述精确定位旋转角度即为文本行的旋转校正角度。采用本申请的技术方案的有益效果如下:本申请采用投影技术,根据投影曲线的宽高比与文本行倾斜角度的对应关系,能够快速精确定位到文本行方向并计算旋转校正角度,从而获得水平方向的文本行图像,本申请的投影方法高效精确,具有良好的稳定性;通过粗定位和精细定位过程,提高运算速率,提升了算法的准确性;本申请易于实施、算法复杂度低,具有普适性,适于行业内推广应用。附图说明为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请第一方面的实施例的流程框图;图2为本申请实施例的降采样处理示意图;图3为本申请实施例中粗定位过程和精确定位过程示意图;图4为本申请实施例中水平方向投影曲线生成示意图。具体实施方式下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。参见图1,为本申请第一方面的实施例的流程框图,以便于理解下述实施例的技术方案。本申请的第一方面,提供一种基于投影的文本行旋转校正方法,包括以下步骤:S101,获取待校正文本图像;S102,旋转所述待校正文本图像,沿水平方向对初始状态以及旋转后的所述待校正文本图像进行像素点累积投影,获取各组水平方向投影曲线;S103,根据所述各组水平方向投影曲线,计算各组投影曲线的宽高比;S104,根据所述各组投影曲线的宽高比,将所述各组投影曲线的宽高比最大值所对应的旋转的角度确定为旋转校正角度;S105,将所述待校正文本图像旋转所述旋转校正角度,获得校正后的文本图像。本实施例中,通过水平方向进行像素点累积投影,可针对单行或多行文本,利用投影技术获取水平方向投影曲线,在水平方向投影曲线中,曲线的点位数据反映了文本的方向信息,本申请通过投影曲线的宽高比与文本行的倾斜角度的对应关系,将两者的数据信息相结合,确定投影曲线的宽高比数据信息以搜索并确定文本行的方向,从而完成文本行的旋转校正工作。本实施例中的“初始状态”,本文档来自技高网...

【技术保护点】
1.一种基于投影的文本行旋转校正方法,其特征在于,包括以下步骤:/n获取待校正文本图像;/n旋转所述待校正文本图像,沿水平方向对初始状态以及旋转后的所述待校正文本图像进行像素点累积投影,获取各组水平方向投影曲线;/n根据所述各组水平方向投影曲线,计算各组投影曲线的宽高比;/n根据所述各组投影曲线的宽高比,将所述各组投影曲线的宽高比最大值所对应的旋转的角度确定为旋转校正角度;/n将所述待校正文本图像旋转所述旋转校正角度,获得校正后的文本图像。/n

【技术特征摘要】
1.一种基于投影的文本行旋转校正方法,其特征在于,包括以下步骤:
获取待校正文本图像;
旋转所述待校正文本图像,沿水平方向对初始状态以及旋转后的所述待校正文本图像进行像素点累积投影,获取各组水平方向投影曲线;
根据所述各组水平方向投影曲线,计算各组投影曲线的宽高比;
根据所述各组投影曲线的宽高比,将所述各组投影曲线的宽高比最大值所对应的旋转的角度确定为旋转校正角度;
将所述待校正文本图像旋转所述旋转校正角度,获得校正后的文本图像。


2.根据权利要求1所述的基于投影的文本行旋转校正方法,其特征在于,在所述获取待校正文本图像的步骤之后,还包括:
对所述待校正文本图像进行预处理,获得二值化文本图像。


3.根据权利要求2所述的基于投影的文本行旋转校正方法,其特征在于,所述对所述待校正文本图像进行预处理,包括:
对所述待校正文本图像进行阈值分割,获得二值化文本图像。


4.根据权利要求2所述的基于投影的文本行旋转校正方法,其特征在于,在所述对所述待校正文本图像进行预处理,获得二值化文本图像的步骤之后,还包括:
对所述二值化文本图像进行降采样处理,获得降采样文本图像。


5.根据权利要求2所述的基于投影的文本行旋转校正方法,其特征在于,所述对所述待校正文本图像进行预处理,包括:
对所述待校正文本图像进行边缘特征提取或聚类分析处理,获得二值化文本图像。


6.根据权利要求1-5任一所述的基于投影的文本行旋转校正方法,其特征在于,在所述根据所述投影曲线的宽高比,将所述投影曲线的宽高比最大值所对应的角度确定为旋转校正角度的步骤中,包括:
先进行粗定位,然后进行精确定位后确定旋转校正角度;
所述粗定位过程包括:先输入角度搜索范围,再计算各个角度下投影曲线的宽高比,从中挑选出宽高比最大值所对应的角度确定为粗定位旋转角度;
所述精确定位过程包括:先计算精确定位角度搜索范围,再计算各个角度下...

【专利技术属性】
技术研发人员:王玉娇
申请(专利权)人:凌云光技术股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1