基于背景估计和能量最小化的低质量文档图像二值化方法技术

技术编号:16154551 阅读:87 留言:0更新日期:2017-09-06 19:08
本发明专利技术公开了一种基于背景估计和能量最小化的低质量文档图像二值化方法,首先对彩色文档图像进行灰度预处理、采用双边滤波对图像进行降噪处理、图像背景估计、背景减除与图像增强、构造能量函数、构造网络图、最后采用基于增广路径的图割算法实现能量函数的最小化。本发明专利技术显著提高了复杂背景下的文档图像二值化效果,能够适用于多种颜色书写、笔画渐变、墨迹浸润、页面有污渍或纹理、光照不均、对比度低等复杂背景的文档图像二值化处理。

【技术实现步骤摘要】
基于背景估计和能量最小化的低质量文档图像二值化方法
本专利技术属于数字图像处理、模式识别与机器学习
,特别是涉及一种基于背景估计和能量最小化的低质量文档图像二值化方法。
技术介绍
文档分析与识别(DAR)技术已广泛应用于古籍数字化、版面分析与文字识别、视频字幕提取、文本信息检索等领域,主要包括图像的采集、二值化、歪斜校正、字符分割与识别等过程。图像二值化是其中一个关键预处理环节,它是将灰度图像转换成二进制图像,从而实现字符前景与文档背景的分离。二值化算法的效果直接影响整个DAR系统的性能,因此近年来很多学者对此进行了研究,并提出了很多算法;然而,受图像对比度差、墨迹浸润、页面污渍或光照不均等因素的影响,使得低质量文档图像二值化仍是一个挑战。二值化算法可粗略分为全局阈值法和局部阈值法。全局阈值法采用单一的阈值将文档图像分为字符(前景)与背景两大类,如Otsu算法利用图像的灰度直方图选择一个最优阈值,使得经阈值分割后的前景与背景像素的类间方差最大。全局阈值法对于前景和背景差别较大,即直方图具有显著双峰特征的图像具有较好的分割效果,但在处理低质量文档图像时,会丢失部分甚至全部前景细节本文档来自技高网...
基于背景估计和能量最小化的低质量文档图像二值化方法

【技术保护点】
一种基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于,包括以下步骤:步骤1:对彩色文档图像进行灰度预处理;步骤2:采用双边滤波对图像进行降噪处理;步骤3:图像背景估计,具体包括以下子步骤:步骤3.1:针对步骤2处理后的图像,进行笔画宽度变换;步骤3.2:计算模拟距离和成像高度;步骤3.3:针对步骤2处理后的图像,通过两次形态学闭操作削弱文档图像中的暗特征;步骤3.4:结合步骤3.2和步骤3.3的结果,进行图像降采样和升采样;步骤4:背景减除与图像增强,具体包括以下子步骤:步骤4.1:背景减除;计算步骤2中的双边滤波图像与步骤3中的背景估计图像间的绝对差值,差值图像中灰度为零的像素...

【技术特征摘要】
1.一种基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于,包括以下步骤:步骤1:对彩色文档图像进行灰度预处理;步骤2:采用双边滤波对图像进行降噪处理;步骤3:图像背景估计,具体包括以下子步骤:步骤3.1:针对步骤2处理后的图像,进行笔画宽度变换;步骤3.2:计算模拟距离和成像高度;步骤3.3:针对步骤2处理后的图像,通过两次形态学闭操作削弱文档图像中的暗特征;步骤3.4:结合步骤3.2和步骤3.3的结果,进行图像降采样和升采样;步骤4:背景减除与图像增强,具体包括以下子步骤:步骤4.1:背景减除;计算步骤2中的双边滤波图像与步骤3中的背景估计图像间的绝对差值,差值图像中灰度为零的像素点属于高置信背景像素点,并将其灰度值设为255;步骤4.2:直方图均衡;对背景减除图像中非零像素点进行取反,得到该点对应的灰度值,然后对整幅图像进行直方图均衡化,增大图像前景和背景的对比度;步骤5:构造能量函数;步骤6:构造网络图;步骤7:采用基于增广路径的图割算法实现能量函数的最小化。2.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤1中采用最小均值法对彩色文档图像f(x,y)进行灰度预处理,其中预处理公式为:其中,fi(x,y)分别为R、G、B彩色分量图像,fgray(x,y)为变换后的灰度图像。3.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤2中采用非线性双边滤波算法进行图像降噪处理,其输出像素值依赖于邻域S内像素值f(k,l)的加权组合,具体计算公式为:其中,权重系数w(i,j,k,l)取决于定义域核和值域核的乘积,即和分别表示高斯距离方差和高斯灰度方差。4.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤3.1中采用Canny算子对双边滤波后的灰度图像进行边缘检测,并对每一个边缘像素点p按其梯度方向查找与之对应的另一个边缘像素点q,两点间的欧式距离||p-q||即为[p,q]路径上所有像素点的笔画宽度估计,除非该像素点已经被指定了一个更小的宽度值,则图像的笔画宽度SWE为所有非零像素点笔画宽度估计的数学期望,具体计算公式为:其中,n为笔画宽度变换输出图像s(x,y)中非零值像素点总数。5.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤3.2中,并根据步骤3.1估计得到的笔画宽度SWE确定模拟观测距离d0,具体计算公式为:d0=SWE×cotθ,其中,θ为观测分辨...

【专利技术属性】
技术研发人员:熊炜徐晶晶李敏熊子婕王改华刘敏赵楠王鑫睿冯川
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1