一种纹理背景下的字符全自动软分割方法技术

技术编号:20161095 阅读:13 留言:0更新日期:2019-01-19 00:13
本发明专利技术公开了一种纹理背景下的字符全自动软分割方法,首先对输入的字符图像I1通过灰度化预处理后得到灰度图像I2,采用双阈值OTSU分割算法得到灰度图像I2的两个分割阈值,使用波谷搜索策略并基于较低阈值寻找灰度图像I2直方图的波谷位置,以波谷位置为阈值对直方图进行阈值化得到图像I3;然后利用形态学对图像I3的前景部做腐蚀操作得到图像I4,做膨胀操作得到图像I5,将图像I5前景部分去除图像I4的前景部分标识为未知区域,标识图像I4的前景部分为前景区域,将图像I3范围内除去未知区域和前景区域的区域标识为背景区域,由未知区域、前景区域和背景区域构成三分图;最后使用抠像算法和连通域分析方法得到每个字符区域,实现软分割操作;本发明专利技术有效提升了字符分割的准确率。

【技术实现步骤摘要】
一种纹理背景下的字符全自动软分割方法
本专利技术属于图像处理领域,尤其涉及一种纹理背景下的字符全自动软分割方法。
技术介绍
字符分割是字符识别任务中的一个步骤。字符识别任务是从一幅包含字符的图像到输出识别的字符,该任务可以分解为多个步骤,包含:字符区域检测,倾斜校正,字符分割,字符识别等几个步骤。字符分割在字符识别任务中是一个核心关键步骤,在证件、票据、车牌等对象的字符识别任务中字符分割的准确性往往决定着相关产品的性能。常用的字符分割方式主要有阈值法、连通域法、投影法和基于纹理特征的方法。阈值法简单快速,但是当背景与前景之间的灰度值相近时,很容易失效;连通域法可以得到每个字符的所在矩形,通过连通域面积可以过滤掉一些噪声,但是当图像背景中有较多纹理时,该方法性能会显著下降;投影法是目前使用较多的一种方法,该法巧妙地利用了字符区域在水平和垂直方向上的投影的分布特征,从而找到字符在水平和垂直方向上的分割位置,但是该法需要将背景噪声或者纹理完全去除后才能正常运行;基于纹理特征的方法的思想是提取文字的纹理特征,然后通过分类器对文字和背景进行分类,该方法的问题在于文字的纹理特征往往不太稳定,较难描述和提取。如果不考虑由于光照,运动等造成的图像质量问题和文字粘连、单个文字有多个分离部分等文字本身的问题,而仅仅考虑将文字的形状(单个文字或者单个文字中的独立连通部分)从背景中提取出来,字符分割任务中的难点主要有两点。首先背景纹理或噪声是影响字符分割准确性的一大因素,阈值法、连通域法和投影法都需要在背景相对比较干净的前提条件下才能运行良好。其次,在字符图像中,单个字符的像素个数较少,而由于成像过程中不可避免的边缘模糊效应,会造成字符边缘与背景纹理相互融合,在字符边缘部分较难判定某个像素是属于背景还是字符,如果字符笔画本身较细,则边缘部分像素的判定对于字符的形状的影响将变得较大。例如,在印刷品中通常背景部分有若干底纹,有些情况下底纹的灰度值和前景字符的灰度值差异不大,用传统的阈值分割法较难将背景与字符较好分割出来。再者,由于成像过程中不可避免的边缘模糊效应,字符边缘与背景纹理过度较为平缓,而有些字符图像中,字符的笔画较细,像素尺寸较少,此时字符边缘部分在字符笔画中占比较大。这些难以确定前景还是背景的边缘像素值的归属对于分割后的字符形状的影响较大:较难设计一个算法自动找到一个合适的阈值将正确的字符形状分割出来,阈值稍微偏高可能造成字符笔画过粗,甚至在字符轮廓中包含一些背景纹理,阈值稍微偏低又可能造成字符笔画或细,甚至可能造成某些笔画断裂。
技术实现思路
本专利技术的主要目的在于提供了一种纹理背景下的字符全自动软分割方法,用以解决现有技术中在印刷品中存在的底纹灰度值与字符灰度值相近导致难以分割背景与字符和对字符边缘较大的字符图形分割过程中可能导致字符断裂的问题;具体技术方案如下:一种纹理背景下的字符全自动软分割方法,所述方法利用双阈值OTSU分割算法和波谷搜索策略,并同时结合形态学、抠像算法和连通域分析方法实现对纹理背景下的字符分割,所述方法包括步骤:S1、输入字符图像I1,并对所述字符图像I1经过灰度化预处理后得到灰度图像I2;S2、对所述灰度图像I2应用双阈值OTSU分割算法,得到第一分割阈值和大于所述第一分割阈值的第二分割阈值,记录所述第一分割阈值为t1;S3、获取所述灰度图像I2对应的直方图,并在所述直方图中以t1为初始位置采用波谷搜索策略寻找所述直方图的波谷位置T;S4、以T为阈值对所述灰度图像I2阈值化,得到图像I3;S5、对所述图像I3的前景部分进行形态学腐蚀操作得到图像I4;对所述图像I3的前景部分进行形态学膨胀操作得到图像I5;S6、将所述图像I4的前景部分标识为前景区域Rf,使用形态学将所述图像I5的前景部分去除所述图像I4的前景部分得到未知区域Ru,并将所述图像I3除去所述前景区域Rf和未知区域Ru的区域标识为背景区域Rb,由所述前景区域Rf、未知区域Ru和背景区域Rb组成三分图;S7、采用抠像算法对所述字符图像I1和所述三分图进行抠像操作,得到alpha抠像图,并将所述alpha抠像图作为字符序列的软分割结果图像S;S8、将所述软分割结果图像S中像素值大于127的像素设置为白色,其余像素设置为黑色,得到二值图像I6,并求取所述二值图像I6中黑色像素的连通域;S9、设定一连通域面积阈值,滤除面积小于所述连通域面积阈值的所有所述连通域,并求取面积大于所述连通域面积阈值的每一所述连通域各自的包围矩形;S10、设定一拓展率,按照所述拓展率拓展所述包围矩形,得到n个与所述包围矩形相对应的拓展矩形区域,并依次标记所述拓展矩形区域为R1,R2,...,Rn;S11、提取所述软分割结果图像S在所述拓展矩形区域R1,...,R2,Rn的子图像S1,...,S2,Sn,实现对纹理背景下字符的全自动软分割操作。作为优选,在步骤S1中,若所述灰度图像I2中背景的整体亮度暗于前景字符,则对所述灰度图像I2做灰度反转操作。作为优选,所述灰度反转操作可通过公式s=L-1-r,其中,s表示经过所述灰度反转操作后所述灰度图像I2的灰度值,L表示所述灰度图像I2的灰度等级数,r表示所述灰度图像I2的原始灰度值。作为优选,所述alpha抠像图为八位灰度图像,所述alpha抠像图的前景像素隶属度越高,则所述alpha抠像图的像素越黑。与现有技术相比,本专利技术的纹理背景下的字符全自动软分割方法有益效果为:(1)本专利技术先采用双阈值OTSU分割算法得到第一分割阈值和大于第一分割阈值的第二分割阈值,并在字符图像I1灰度化的灰度图像I2对应的直方图中寻找第一分割阈值附近的波谷位置作为分割阈值;在此基础上再通过形态学腐蚀处理、软分割结果的隶属度阈值化处理、连通域分析排除可能留下的一些底纹残迹区域,以达到对字符图像的背景纹理的有效去除。(2)本专利技术采用抠图算法得到alpha抠像图后,一方面,最终得到的软分割图像可以根据alpha抠像图中alpha取值大小实现通过软分割方法得到传统硬分割方法可以得到效果;另一方面,本专利技术还可以由alpha抠像图中的隶属度与设定不同阈值比较后实现对字符不同粗细的分割结果,由此可以为后续的识别操作提供不同分割结果,从而实现对字符更加准确的识别。(3)本专利技术利用抠像算法能够找出字符边缘附近与背景的融合程度,用该融合程度来反映边缘像素的归属是属于字符图像I1中的字符还是背景纹理,从而可以有效避免由于成像过程中的边缘模糊效应导致的字符图像I1中字符边缘与背景纹理基本融合在一起的情况,可得到边缘较自然的字符;而且可避免传统硬分割方法可能造成的字符笔画过粗、字符与背景纹理粘连或者字符笔画过细以及出现字符笔画断裂的现象。附图说明图1为本专利技术实施例中所述纹理背景下的字符全自动软分割方法的流程框图示意;图2为本专利技术实施例中所述字符图像I1得到的灰度图像I2示意;图3为本专利技术实施例中所述灰度图像I2的直方图图形化示意;图4为本专利技术实施例中所述双阈值OTSU分割算法得到的阈值和波谷搜索策略得到的阈值图示意;图5为本专利技术实施例中所述灰度图像I2用双阈值OTSU分割算法得到的第二分割阈值进行阈值化的结果示意图;图6为本专利技术实施例中采用所述波谷搜索策略以本文档来自技高网
...

【技术保护点】
1.一种纹理背景下的字符全自动软分割方法,其特征在于,所述方法利用双阈值OTSU分割算法和波谷搜索策略,并同时结合形态学、抠像算法和连通域分析方法实现对纹理背景下的字符分割,所述方法包括步骤:S1、输入字符图像I1,并对所述字符图像I1经过灰度化预处理后得到灰度图像I2;S2、对所述灰度图像I2应用双阈值OTSU分割算法,得到第一分割阈值和大于所述第一分割阈值的第二分割阈值,记录所述第一分割阈值为t1;S3、获取所述灰度图像I2对应的直方图,并在所述直方图中以t1为初始位置采用波谷搜索策略寻找所述直方图的波谷位置T;S4、以T为阈值对所述灰度图像I2阈值化,得到图像I3;S5、对所述图像I3的前景部分进行形态学腐蚀操作得到图像I4;对所述图像I3的前景部分进行形态学膨胀操作得到图像I5;S6、将所述图像I4的前景部分标识为前景区域Rf,使用形态学将所述图像I5的前景部分去除所述图像I4的前景部分得到未知区域Ru,并将所述图像I3除去所述前景区域Rf和未知区域Ru的区域标识为背景区域Rb,由所述前景区域Rf、未知区域Ru和背景区域Rb组成三分图;S7、采用抠像算法对所述字符图像I1和所述三分图进行抠像操作,得到alpha抠像图,并将所述alpha抠像图作为字符序列的软分割结果图像S;S8、将所述软分割结果图像S中像素值大于127的像素设置为白色,其余像素设置为黑色,得到二值图像I6,并求取所述二值图像I6中黑色像素的连通域;S9、设定一连通域面积阈值,滤除面积小于所述连通域面积阈值的所有所述连通域,并求取面积大于所述连通域面积阈值的每一所述连通域各自的包围矩形;S10、设定一拓展率,按照所述拓展率拓展所述包围矩形,得到n个与所述包围矩形相对应的拓展矩形区域,并依次标记所述拓展矩形区域为R1,R2,...,Rn;S11、提取所述软分割结果图像S在所述拓展矩形区域R1,...,R2,Rn的子图像S1,...,S2,Sn,实现对纹理背景下字符的全自动软分割操作。...

【技术特征摘要】
1.一种纹理背景下的字符全自动软分割方法,其特征在于,所述方法利用双阈值OTSU分割算法和波谷搜索策略,并同时结合形态学、抠像算法和连通域分析方法实现对纹理背景下的字符分割,所述方法包括步骤:S1、输入字符图像I1,并对所述字符图像I1经过灰度化预处理后得到灰度图像I2;S2、对所述灰度图像I2应用双阈值OTSU分割算法,得到第一分割阈值和大于所述第一分割阈值的第二分割阈值,记录所述第一分割阈值为t1;S3、获取所述灰度图像I2对应的直方图,并在所述直方图中以t1为初始位置采用波谷搜索策略寻找所述直方图的波谷位置T;S4、以T为阈值对所述灰度图像I2阈值化,得到图像I3;S5、对所述图像I3的前景部分进行形态学腐蚀操作得到图像I4;对所述图像I3的前景部分进行形态学膨胀操作得到图像I5;S6、将所述图像I4的前景部分标识为前景区域Rf,使用形态学将所述图像I5的前景部分去除所述图像I4的前景部分得到未知区域Ru,并将所述图像I3除去所述前景区域Rf和未知区域Ru的区域标识为背景区域Rb,由所述前景区域Rf、未知区域Ru和背景区域Rb组成三分图;S7、采用抠像算法对所述字符图像I1和所述三分图进行抠像操作,得到alpha抠像图,并将所述alpha抠像图作为字符序列的软分割结果图像S;S8、将所述软分割结果图像S中像素值大于127的像...

【专利技术属性】
技术研发人员:林忠黄陈蓉卢阿丽周静波
申请(专利权)人:南京工程学院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1