【技术实现步骤摘要】
本专利技术涉及图像二值化技术,尤其涉及用于文档图像的自适应二值化方法和设备。
技术介绍
近年来,随着图像处理技术的迅速发展,文档图像光学字符识别(OCR)正得到广 泛的应用。作为一种图像预处理技术,文档图像二值化处理经常在OCR系统中被用到。二 值化处理是将彩色或灰度级图像转换成黑白图像的过程,其中黑白图像只具有黑、白两个 灰度级。 有许多种用于文档图像的全局或自适应的二值化方法。二值化方法的例子包 括Otsu方法,用于根据灰度直方图计算阈值(参见〃 A ThresholdSelection Method from Gray-Level Histograms 〃 , IEEE Trans. On systems, Man,30and cybernetics, Vol. SMC-9, No. 1, pp. 62-66, January 1979) , Niblack方法,用于基于图像的局部均 值禾口标准差计算阈值(参见〃 Anlntroduction to Digitall Image Processing, Prentice-Hal 1, EnglewoodCl ...
【技术保护点】
一种用于文档图像的自适应二值化设备,包括:估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。
【技术特征摘要】
一种用于文档图像的自适应二值化设备,包括估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。2. 如权利要求l所述的自适应二值化设备,其中,估计器还根据在行和列中的另一个方向上文档图像的每一组像素,估计该组的每个像 素的第二背景灰度级,以获得文档图像的第二背景图像,计算器还针对文档图像的每个像素,计算以该像素为中心的第二像素区域中所有像素 到第二背景图像的平均距离r,并计算该像素的第二背景灰度级和与平均距离r正相关的 量d之间的差,以作为该像素的第二阈值,并且提取器还根据第二阈值从文档图像中提取出第二二值化图像,其中,第二背景灰度级的估计所基于的像素区间和第二像素区域的尺寸大于所述预定 尺寸,其中,所述自适应二值化设备还包括 图像合并器,获得第一和第二二值化图像间的逻辑与图像。3. 如权利要求1或2所述的自适应二值化设备,其中,在计算第一和第二阈值时,d = kXr,O < k < 2。4. 如权利要求1或2所述的自适应二值化设备,其中,在计算第一和第二阈值时,d = kX (rn+|r-rn|),0 < k < 2, rn为文档图像的估计噪声。5. 如权利要求1或2所述的自适应二值化设备,其中,所述...
【专利技术属性】
技术研发人员:郑大念,孙俊,直井聪,堀田悦伸,皆川明洋,藤本克仁,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。