一种文档图像二值化方法技术

技术编号：2942170 阅读：207 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及图像处理与模式识别学技术领域，特别是一种文档图像的二值化方法。针对现有图像二值化技术处理低质量文档图像的能力不足，提出了一种新的文档图像二值化方法，首先对图像进行前背景像素初始标定，在此基础上分析笔划邻域信息，包括灰度信息、梯度信息和几何信息，然后，基于笔划邻域信息对文字笔划进行图像增强，最后在增强后的图像上进行二值化。同时，本发明专利技术还提出了一种快速前背景像素标定方法和一种改进的基于Ｎｉｂｌａｃｋ方法的二值化阈值求取方法，用于上述的二值化方法中。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理与模式识别学
，特别是一种文档图像的二值化方法。
技术介绍
图像二值化是指一种图像处理技术，它将灰度图像转化为单色图像，以便进行进一步的分析和处理。文档图像的应用越来越广泛，我们处理的第一步往往就是将文档图像进行二值化，在此基础上获得文字图像，再进行文字识别工作。图像二值化结果的好坏直接影响文字识别的结果。在文档图像中，光照变化、模糊、分辨率不足等降质现象给二值化带来消极影响。他们往往导致在文字像素附近，很多背景像素与文字像素灰度非常接近。文字局部区域的前背景像素灰度级分布有可能存在相隔紧密甚至发生交叠情况的时候，采用通常的方法很难很好地分离前背景。光学图象在采集过程中存在点扩散效应，是产生文字模糊现象的重要因素之一。当笔划密集，间隔较小的时候，不同笔划之间的空隙会因为扩散作用的影响变得非常模糊，以至难以区分开来。这种情况在光照变化、分辨率较低的情况下会变得更加恶劣化。而对于一些字符笔划较多的语种例如中文的文档来说，笔划密集的情况是常见的，这个情况尤其值得重视。现有的二值化方法在处理文档图像中文字局部区域内前背景图像的灰度直方图存在重叠的情况时，效果均不够理想。通常，把二值化方法分为两类，一类是全局的方法。如Otsu方法，采用最大类方差的方法确定分割阈值。吴坤荣在专利“影响二值化方法”中提出了一种基于像素累积直方图中寻找二值化临界值的作为阈值的二值化方法。徐剑波在专利“一种图像二值化的方法”中提出了一种能面向灰度直方图双峰偏移情况的图像二值化方法。全局阈值的方法实现简单，速度较快，但不能适应光照变化图像，处理质量较差的图像也...

【技术保护点】
一种文档图像二值化方法，包括以下步骤：Ｓｔｅｐ１．图像前背景像素初始标定；Ｓｔｅｐ２．获取笔划邻域信息；Ｓｔｅｐ３．基于笔划邻域信息增强文字笔划；Ｓｔｅｐ４．在笔划增强的图像上进行最终二值化。

【技术特征摘要】

【专利技术属性】
技术研发人员：朱远平，王春恒，戴汝为，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人