文档的自适应二值化方法和设备技术

技术编号:2928530 阅读:164 留言:0更新日期:2012-04-11 18:40
本申请涉及一种对文档进行自适应二值化的方法、设备和存储介质。本发明专利技术的对灰度级文档图像进行自适应二值化的方法包括:划分步骤,将灰度级文档划分为块;第一确定步骤,根据块的特征确定所划分的块当中的背景块和文本块;第二确定步骤,确定第一确定步骤所确定的每一个文本块所包括的像素中的背景像素;第一计算步骤,计算表示每一个块的阈值的块阈值面,其中,基于第一确定步骤所确定的背景块中所包括的所有像素计算该背景块的阈值,基于第一确定步骤所确定的文本块中所包括的背景像素计算该文本块的阈值,背景像素是在第二确定步骤中所确定的;以及二值化步骤,使用第一计算步骤所计算的块阈值面来将灰度级文档图像二值化。

【技术实现步骤摘要】

本专利技术总体上涉及文档图像处理,尤其涉及光学字符识别(OCR)。更具体地,涉及文档的自适应二值化方法、设备和存储介质。
技术介绍
文档图像的二值化是文档图像分析系统比如光学字符识别系统中的第一步。阈值分割操作的输出结果是二值图像,其中的一个状态表示前景对象也就是印刷文本,其互补状态对应于背景。二值化方法可以分为两类全局和局部阈值分割技术,见.D.Trier and A.K.Jain.Goal-directed evaluation of binarizaton methods,IEEETransactions on Pattern Analysis and MachineIntelligence,17(12)1191-1201,1995,Yibing Yang and Hong Yan.Anadaptive logical method for binarization of degraded document images,Pattern Recognition,33(5)787-807,2000,以及Xiangyun Ye,Mohamed Cheriet.and Ching Y.Suen.Stroke-modelbased characterextraction from gray-level document images,IEEE Transactions onImage Processing,10(8)1152-1161,2001。在许多情况下,属于背景的像素的灰度级与属于对象的像素的灰度级有相当大的不同。这样阈值分割就是一种简单而有效的将对象与背景分开的工具。在这些情况下,最简单的也是最早期的方法是全局阈值分割技术。最通用的全局阈值分割技术,例如Otsu方法和Kapur方法(见.D.Trier and A.K.Jain.Goal-directed evaluation ofbinarizaton methods,IEEE Transactions on Pattern Analysis andMachine Intelligence,17(12)1191-1201,1995),系基于直方图分析。确定阈值的尺度是最好地将对应于直方图的峰的灰度级分离出来,这些峰分别对应于图像中的不同部分比如背景或者对象的图像像素。存在各种因素对二值图像的质量有不利的影响。这些因素包括1.由于不均匀的照度和不适当的储存,造成背景强度的变化;2.在文档图像的捕获处理中,由于污点、污渍和阴影而造成非常低的局部对比度;3.非固定的和与信号有关的噪声;4.图像的前景区和背景区之间对比度有变化;5.文档反面的文本的渗透;以及6.灰度级图像的分辨率低。所有这些变量使得二值化过程非常复杂。要选择“最好”的二值化方法是非常困难的。OCR方法(以及其它图像处理方法)因而就不那么有效。理想的自适应阈值分割方法应当是,当应用于照度不均匀的页面时,应当产生与全局阈值分割方法应用于照度非常均匀的页面时一样的结果。每一个像素的亮度被归一化,以对照度的多少进行补偿。之后才判断结果应当是黑还是白。那么问题就是如何确定每一个点处的背景照度。图1大致上就是基于这种描述。它是一种根据背景照度计算在整个图像上变化的阈值的技术。首先,该技术将图像分为小一些的块(步骤S102),然后用许多方法计算每一个块的阈值(步骤S104),这些方法例如是*计算每一个块的直方图。根据这些直方图的峰为每一个块选择阈值;*根据梯度大的位置计算阈值。这些梯度大的位置是利用梯度像素的局部极大来抽取的;*通过从被识别为字符边界的区域进行抽取和插值获得阈值,字符边界是用二次导数方法提取的。然后,通过在对每一个块选取的值之间进行插值,对图像中的每一个点分配一个阈值(步骤S106)。最后,使用所得到的阈值对图像进行二值化(步骤S108)。结果比全局化阈值分割好得多。现有技术中有关二值化技术的文献将注意力集中在不同的特殊情况下,具有如下缺点1.全局阈值分割技术适合高质量的文档图像,但是对于质量不好的文档工作得就不是很好;2.局部阈值分割技术对小尺寸的图像工作得不是很好,因为图像首先要抽样缩小为较小的块,然后再扩大。边界填充会严重影响最后的结果;3.某些局部平均阈值分割技术例如Niblack方法常常放大噪声,倾向于将大面积的背景区域误分类为文本;4.这些技术常常需要使用边缘检测技术、间隔剔除方法和/或后期处理,以去除“鬼像”对象;5.局部阈值分割技术要求多次读图像,非常慢,也不适合高质量图像。另外,在寻求更好的方法时,应当认识到阈值分割方法的优点应当在于计算和实现上的简单。如果为了改进效果而使其过于复杂,则在精密程度上分段方法可以超过它。
技术实现思路
因此,本专利技术的一个目的是提供一种进行有效的自适应二值化的方法和设备。为了实现上述目的,专利技术人提出了结合一种简单的预处理步骤,从而避免其它的局部自适应阈值分割方法在处理小尺寸图像或者高质量图像时存在的问题;并且隐含地将灰度级像素阈值分割问题转换为块特征分类问题。专利技术人提出并且验证了各种通用的文本特征都适用于块特征提取,对于本专利技术的二值化方案中的最终二值化结果只有微不足道的影响。专利技术人还提出并验证了块特征分类问题在本二值化方案中也是非常微不足道的,因此对于块特征分类来说通用的全局阈值分割方法就足够了。在块阈值分配步骤,专利技术人原创地提出并验证了在本二值化方案中,用二阶导数方法获得的局部平均能够对质量差的图像实现变得清晰的二值化结果,而其它类似方法达不到这样好的结果。这种结果对于数字照相机OCR来说尤其重要。专利技术人还设计了一种新的自适应偏移值,在本二值化方案中,其能够有利于稀疏文本图像的处理。具体地,提供了一种对灰度级文档图像进行自适应二值化的方法,该方法包括划分步骤,将灰度级文档划分为块;第一确定步骤,根据块的特征确定所划分的块当中的背景块和文本块;第二确定步骤,确定所述第一确定步骤所确定的每一个文本块所包括的像素中的背景像素;第一计算步骤,计算表示每一个块的阈值的块阈值面,其中,基于所述第一确定步骤所确定的背景块中所包括的所有像素计算该背景块的阈值,基于所述第一确定步骤所确定的文本块中所包括的背景像素计算该文本块的阈值,所述背景像素是在所述第二确定步骤中所确定的;以及二值化步骤,使用所述第一计算步骤所计算的块阈值面来将所述灰度级文档图像二值化。本专利技术还提供了一种对灰度级文档图像进行自适应二值化的设备,该设备包括划分装置,将灰度级文档划分为块;第一确定装置,根据块的特征确定所划分的块当中的背景块和文本块;第二确定装置,确定所述第一确定装置所确定的每一个文本块所包括的像素中的背景像素;第一计算装置,计算表示每一个块的阈值的块阈值面,其中,基于所述第一确定装置所确定的背景块中所包括的所有像素计算该背景块的阈值,基于所述第一确定装置所确定的文本块中所包括的背景像素计算该文本块的阈值,所述背景像素是在所述第二确定装置中所确定的;以及二值化装置,使用所述第一计算装置所计算的块阈值面来将所述灰度级文档图像二值化。还提供了一种存储介质,其特征在于在其中存储了用于实现上述方法的程序代码。本专利技术具有下述优点中的一个或者多个1.该解决方案在高速和高本文档来自技高网
...

【技术保护点】
一种对灰度级文档图像进行自适应二值化的方法,该方法包括:划分步骤,将灰度级文档划分为块;第一确定步骤,根据所划分的块的特征确定所述块当中的背景块和文本块;第二确定步骤,确定所述第一确定步骤所确定的每一个文本块所包括的 像素中的背景像素;第一计算步骤,计算表示每一个块的阈值的块阈值面,其中,基于所述第一确定步骤所确定的背景块中所包括的所有像素计算该背景块的阈值,基于所述第一确定步骤所确定的文本块中所包括的背景像素计算该文本块的阈值,所述背景像素是在 所述第二确定步骤中所确定的;以及二值化步骤,使用所述第一计算步骤所计算的块阈值面来将所述灰度级文档图像二值化。

【技术特征摘要】

【专利技术属性】
技术研发人员:曾旭李献肖其林
申请(专利权)人:佳能株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1