基于投影的文本行字符分割方法及装置制造方法及图纸

技术编号:26420040 阅读:18 留言:0更新日期:2020-11-20 14:15
本申请属于图像识别技术领域,具体涉及一种基于投影的文本行字符分割方法及装置。在图像识别技术领域,现有的光学字符识别技术在识别速率和准确度上亟待提升。本申请提供一种基于投影的文本行字符分割方法及装置,该方法通过水平投影和垂直投影,确定单个字符的实际宽度和高度,对于字符上下边界的判定更加准确,鲁棒性强;通过倾斜字体校正,扩展了字符分割的适用范围。本申请字符投影数据采用灰度图像垂直投影曲线、二值图像垂直投影曲线和边缘强度差分方差投影曲线加权求和,提升了对字符边界判定的准确性和可靠性,有利于字符精确快速分割,对轻度粘连字符及粘连特殊字符的分割同样有效。

【技术实现步骤摘要】
基于投影的文本行字符分割方法及装置
本申请涉及图像识别
,尤其涉及一种基于投影的文本行字符分割方法及装置。
技术介绍
在图像识别
,尤其在光学字符识别中,由于字符的宽度和高度并不完全相同,导致通常无法采用相等的宽度和高度进行分割,因此,需要针对每个字符进行精准分割后才能高效准确地识别字符。如何更准确且高效的分割出单个字符的上下左右边界,避免字符过分割或欠分割,在光学字符识别技术中一直是一个挑战。当前采用的字符分割技术主要有算法识别分割、水平投影法和连通域分析法等方法,但是在识别速率和准确度上亟待提升。
技术实现思路
本申请提供了一种基于投影的文本行字符分割方法及装置,以解决当前字符分割方法亟待提升识别速率和准确度的问题。本申请采用的技术方案如下:本申请的第一方面,提供一种基于投影的文本行字符分割方法,包括以下步骤:获取待分割文本行图像;根据所述待分割文本行图像,判定所述待分割文本行图像中的字体是否为倾斜字体,若是,先进行倾斜字体校正,再计算字符投影数据,若否,则直接计算字符投影数据;对所述字符投影数据进行归一化处理,得到归一化字符分割数据;根据所述归一化字符分割数据,对所述待分割文本行图像进行字符分割。可选的,在所述获取待分割文本行图像的步骤之后,包括:将所述待分割文本行图像进行预处理,所述预处理为将所述待分割文本行图像进行旋转校正,获得水平方向的预处理文本图像。可选的,所述进行倾斜字体校正的步骤包括:r>旋转变形所述待分割文本行图像;对所述待分割文本行图像进行垂直投影,获取各组垂直方向投影曲线;计算各组垂直方向投影曲线字符的水平间隙G(θ);计算各组垂直方向投影曲线的像素点累计均值M(θ);根据所述各组垂直方向投影曲线字符的水平间隙G(θ)和所述各组垂直方向投影曲线的像素点累计均值M(θ),计算字体倾斜角度θ=max(G(θ)*M(θ));对所述待分割文本行图像进行角度θ的旋转变形,获得校正后的待分割文本行图像。可选的,所述进行倾斜字体校正的步骤包括依次进行的粗定位校正过程和精确定位校正过程;所述粗定位校正过程包括如下步骤:输入角度搜索范围;计算各个角度下G(θ)与M(θ)的乘积;挑选出G(θ)*M(θ)为最大值时所对应的角度;确定粗定位字体倾斜角度;所述精确定位校正过程包括如下步骤:计算精确定位搜索范围;计算各个角度下G(θ)与M(θ)的乘积;挑选出G(θ)*M(θ)为最大值时所对应的角度;确定字体倾斜角度;对所述待分割文本行图像进行角度θ的旋转变形,获得校正后的待分割文本行图像。可选的,所述计算字符投影数据的步骤包括:对所述待分割文本行图像进行灰度处理,获得文本行灰度图像,对所述文本行灰度图像进行垂直方向投影,获得灰度图像垂直投影曲线;对所述待分割文本行图像进行二值化处理,获得文本行二值化图像,对所述文本行二值化图像进行垂直方向投影,获得二值图像垂直投影曲线;对所述待分割文本行图像进行边缘强度差分方差处理,获得文本行边缘强度差分方差图像,对所述文本行边缘强度差分方差图像进行边缘强度差分方差投影,获得边缘强度差分方差投影曲线;对所述灰度图像垂直投影曲线、所述二值图像垂直投影曲线和所述边缘强度差分方差投影曲线进行加权求和,获得字符投影数据。可选的,在所述对所述灰度图像垂直投影曲线、所述二值图像垂直投影曲线和所述边缘强度差分方差投影曲线进行加权求和,获得字符投影数据的步骤之前,还包括:对所述灰度图像垂直投影曲线、所述二值图像垂直投影曲线和所述边缘强度差分方差投影曲线进行膨胀处理。可选的,所述字符投影数据中,包括字符的最大宽度数据、字符的实际宽度数据以及字符的实际高度数据。本申请的第二方面,提供一种基于投影的文本行字符分割装置,所述装置包括:待分割文本行图像获取模块,用于获取待分割文本行图像;字符投影数据计算模块,用于根据所述待分割文本行图像,判定所述待分割文本行图像中的字体是否为倾斜字体,若是,先进行倾斜字体校正,再计算字符投影数据,若否,则直接计算字符投影数据;数据归一化模块,用于对所述字符投影数据进行归一化处理,得到归一化字符分割数据;字符分割模块,用于根据所述归一化字符分割数据,对所述待分割文本行图像进行字符分割。可选的,所述待分割文本行图像获取模块中,还包括预处理子模块,所述预处理子模块用于将所述待分割文本行图像进行旋转校正,获得水平方向的预处理文本图像。可选的,所述字符投影数据计算模块还包括倾斜字体校正子模块和字符投影曲线子模块;所述倾斜字体校正子模块用于执行以下步骤:旋转变形所述待分割文本行图像;对所述待分割文本行图像进行垂直投影,获取各组垂直方向投影曲线;计算各组垂直方向投影曲线字符的水平间隙G(θ);计算各组垂直方向投影曲线的像素点累计均值M(θ);根据所述各组垂直方向投影曲线字符的水平间隙G(θ)和所述各组垂直方向投影曲线的像素点累计均值M(θ),计算字体倾斜角度θ=max(G(θ)*M(θ));对所述待分割文本行图像进行角度θ的旋转变形,获得校正后的待分割文本行图像;所述字符投影曲线子模块用于执行以下步骤:对所述待分割文本行图像进行灰度处理,获得文本行灰度图像,对所述文本行灰度图像进行垂直方向投影,获得灰度图像垂直投影曲线;对所述待分割文本行图像进行二值化处理,获得文本行二值化图像,对所述文本行二值化图像进行垂直方向投影,获得二值图像垂直投影曲线;对所述待分割文本行图像进行边缘强度差分方差处理,获得文本行边缘强度差分方差图像,对所述文本行边缘强度差分方差图像进行边缘强度差分方差投影,获得边缘强度差分方差投影曲线;对所述灰度图像垂直投影曲线、所述二值图像垂直投影曲线和所述边缘强度差分方差投影曲线进行加权求和,获得字符投影数据。采用本申请的技术方案的有益效果如下:本申请的基于投影的文本行字符分割方法,通过水平投影和垂直投影,确定了单个字符的实际宽度和高度,对于字符上下边界的判定更加准确,鲁棒性强,通过倾斜字体校正,扩展了字符分割的适用范围。本申请算法复杂度相对较低、字符分割的快速且精确,有利于提高字符识别的准确率。字符投影数据采用灰度图像垂直投影曲线、二值图像垂直投影曲线和边缘强度差分方差投影曲线加权求和,提升了对字符边界判定的准确性和可靠性,有利于字符精确快速分割,对轻度粘连字符及粘连特殊字符的分割同样有效。附图说明为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请第一方面提供的一个本文档来自技高网...

【技术保护点】
1.一种基于投影的文本行字符分割方法,其特征在于,包括以下步骤:/n获取待分割文本行图像;/n根据所述待分割文本行图像,判定所述待分割文本行图像中的字体是否为倾斜字体,若是,先进行倾斜字体校正,再计算字符投影数据,若否,则直接计算字符投影数据;/n对所述字符投影数据进行归一化处理,得到归一化字符分割数据;/n根据所述归一化字符分割数据,对所述待分割文本行图像进行字符分割。/n

【技术特征摘要】
1.一种基于投影的文本行字符分割方法,其特征在于,包括以下步骤:
获取待分割文本行图像;
根据所述待分割文本行图像,判定所述待分割文本行图像中的字体是否为倾斜字体,若是,先进行倾斜字体校正,再计算字符投影数据,若否,则直接计算字符投影数据;
对所述字符投影数据进行归一化处理,得到归一化字符分割数据;
根据所述归一化字符分割数据,对所述待分割文本行图像进行字符分割。


2.根据权利要求1所述的基于投影的文本行字符分割方法,其特征在于,在所述获取待分割文本行图像的步骤之后,包括:
将所述待分割文本行图像进行预处理,所述预处理为将所述待分割文本行图像进行旋转校正,获得水平方向的预处理文本图像。


3.根据权利要求1所述的基于投影的文本行字符分割方法,其特征在于,所述进行倾斜字体校正的步骤包括:
旋转变形所述待分割文本行图像;
对所述待分割文本行图像进行垂直投影,获取各组垂直方向投影曲线;
计算各组垂直方向投影曲线字符的水平间隙G(θ);
计算各组垂直方向投影曲线的像素点累计均值M(θ);
根据所述各组垂直方向投影曲线字符的水平间隙G(θ)和所述各组垂直方向投影曲线的像素点累计均值M(θ),计算字体倾斜角度θ=max(G(θ)*M(θ));
对所述待分割文本行图像进行角度θ的旋转变形,获得校正后的待分割文本行图像。


4.根据权利要求1所述的基于投影的文本行字符分割方法,其特征在于,所述进行倾斜字体校正的步骤包括依次进行的粗定位校正过程和精确定位校正过程;
所述粗定位校正过程包括如下步骤:
输入角度搜索范围;
计算各个角度下G(θ)与M(θ)的乘积;
挑选出G(θ)*M(θ)为最大值时所对应的角度;
确定粗定位字体倾斜角度;
所述精确定位校正过程包括如下步骤:
计算精确定位搜索范围;
计算各个角度下G(θ)与M(θ)的乘积;
挑选出G(θ)*M(θ)为最大值时所对应的角度;
确定字体倾斜角度;
对所述待分割文本行图像进行角度θ的旋转变形,获得校正后的待分割文本行图像。


5.根据权利要求1-4任一所述的基于投影的文本行字符分割方法,其特征在于,所述计算字符投影数据的步骤包括:
对所述待分割文本行图像进行灰度处理,获得文本行灰度图像,对所述文本行灰度图像进行垂直方向投影,获得灰度图像垂直投影曲线;
对所述待分割文本行图像进行二值化处理,获得文本行二值化图像,对所述文本行二值化图像进行垂直方向投影,获得二值图像垂直投影曲线;
对所述待分割文本行图像进行边缘强度差分方差处理,获得文本行边缘强度差分方差图像,对所述文本行边缘强度差分方差图像进行边缘强度差分方差投影,获得边缘强度差分方差投影曲线;
对所述灰度图像垂直投影曲线、所述二值图像垂直投影曲线和所述边缘强度差分方差投影曲线进行加权求和,获得字...

【专利技术属性】
技术研发人员:王玉娇
申请(专利权)人:北京凌云光技术集团有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1