基于笔划宽度的文档图像无参二值化方法技术

技术编号:9991285 阅读:136 留言:0更新日期:2014-05-02 05:21
本发明专利技术公开了一种基于笔划宽度的文档图像无参二值化方法,属于图像处理技术领域。该方法首先对输入的文档图像进行去噪预处理,并通过图像的灰度范围内的各个灰度等级得到一系列的二值化结果,然后通过给定的笔划宽度生成该笔划宽度下的最优二值化结果,最后通过厚笔划像素在目标像素中所占的比重变化确定最佳的笔划宽度和最终的二值化结果。实验结果表明,本发明专利技术中所给出的二值化算法在不需要设置参数的情况下能够自动的二值化文档图像,且二值化的结果具有较高的鲁棒性和分割精度,对文档的智能化自动处理具有重要意义。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种,属于图像处理
。该方法首先对输入的文档图像进行去噪预处理,并通过图像的灰度范围内的各个灰度等级得到一系列的二值化结果,然后通过给定的笔划宽度生成该笔划宽度下的最优二值化结果,最后通过厚笔划像素在目标像素中所占的比重变化确定最佳的笔划宽度和最终的二值化结果。实验结果表明,本专利技术中所给出的二值化算法在不需要设置参数的情况下能够自动的二值化文档图像,且二值化的结果具有较高的鲁棒性和分割精度,对文档的智能化自动处理具有重要意义。【专利说明】
本专利技术涉及一种图像二值化处理的方法,特别是一种基于笔划宽度的文档图像无参全自动二值化方法。
技术介绍
文档图像二值化对于文档的自动化分析具有重要的意义,因为二值化效果的好坏将直接决定后续的识别过程。文档图像二值化是一个经典而富有挑战性的问题,目前已出现了很多种不同的方法,其中基于阈值的方法可以分为两类:全局和局部阈值。其中全局阈值方法以Otsu方法为主,包括各种对该方法的改进,如修改判别准则,着重强调目标区域的灰度同质性,而忽略背景区域的多样性等。笔划作为文档图像中的重要因素,对于文档图像的二值化具有重要影响。如利用笔划宽度的一致性,出现了几种文档图像二值化方法,主要包括:(I)利用形状信息生成全局阈值,(2)利用笔划宽度自适应地生成局部阈值,(3)基于笔划模型从灰度文档图像中抽取字符。现有的基于笔划宽度的文档图像二值化方法存在如下缺陷:(1)笔划的宽度估计方法不具有旋转不变性,或需要事先人为设定;(2)需要训练,不是无监督的方法;(3)是有参的方法,需要针对不同的图像设置不同的参数。
技术实现思路
本专利技术的目的在于提供一种基于笔划宽度的文档图像无参全自动二值化方法。实现本专利技术的目的的技术解决方案为:一种,包括以下步骤:步骤1、对文档图像进行采集;步骤2、采用高斯滤波对采集到的文档图像进行去噪处理;其中高斯滤波的公式为:【权利要求】1.一种,其特征在于,包括以下步骤: 步骤1、对文档图像进行采集; 步骤2、采用高斯滤波对采集到的文档图像进行去噪处理; 步骤3、根据文档图像所在的灰度范围生成二值化结果; 步骤4、根据笔划半径选择最佳的二值化结果,所述初始笔划半径为I ; 步骤5、确定厚笔划像素占目标笔划像素比重的变化量Λ r,所述厚笔划是指笔划半径大于当前笔划半径的笔划; 步骤6、对当前比划半径进行判断,如果当前笔划半径小于最大笔划半径Wmax,则笔划半径加I,然后转到步骤4,否则执行步骤7 ; 步骤7、取最大变化量Ar所对应的笔划宽度和二值化结果作为最终的输出。2.根据权利要求1所述的,其特征在于,步骤2采用高斯滤波对采集到的文档图像进行去噪处理,其中高斯滤波的公式为: 3.根据权利要求1所述的,其特征在于,步骤3中根据文档图像所在的灰度范围生成二值化结果具体为: 采用文档图像的阈值区间(Imin,Imax)内的每个灰度值生成对应的二值化结果,其中Imin和Imax分别表示文档图像的灰度最小值和最大值。4.根据权利要求1所述的,其特征在于,步骤4根据笔划半径选择最佳的二值化结果,具体为: 步骤4-1、确定文本和背景像素的个数,Nt和Nb,具体过程如下: (1)采用形态学闭运算得到厚目标区域TcOk:TcOk = (Bj ?Sk)?Sk ,k=1,2 其中‘ O ’和‘ ? ’分别表示形态学膨胀和腐蚀操作,Sk表示半径为w+k-ι的圆盘形结构元,W为笔划半径,Bi为二值化文档图像; (2)确定细目标区域TnOk,所用公式为: TnOl = Bi \ TcOk = {χ:χ∈ Bi, x (6.TcO, |,k - 1,2 文本区域Tr为细目标区域TnO1与厚目标限制区域Mo相连的区域,其中Mo=M Π TnO2= {x: X e Μ, x e TnO2I,模板从-TnOi ? S2 ; 背景区域为价=B1 \ Tr = J.V: λ- e BrX电Tr],则Nt和Nb分别为文本区域Tr和背景区域Br内的像素个数; 步骤4-2、确定文本和背景像素个数的差异ANi,所述公式为:ANi=Nt1-Nbi, i 的取值为[1, Imax-1min); 步骤4-3、取最大差异ΔΝ对应的文档图像作为当前笔划宽度下的二值化结果输出。5.根据权利要求1所述的,其特征在于,步骤5确定厚笔划像素占目标笔划像素比重的变化量Ar的具体步骤为:n Ft 步骤5-1、确定厚笔划像素在目标像素中所占的比重 6.根据权利要求2所述的,其特征在于,高斯滤波的窗口大小为3X3,标准偏差σ为I。【文档编号】G06K9/60GK103761520SQ201310654770【公开日】2014年4月30日 申请日期:2013年12月5日 优先权日:2013年12月5日 【专利技术者】陈强, 陆圣陶, 汪青, 王玉萍 申请人:南京理工大学本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:陈强陆圣陶汪青王玉萍
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1