用于改善文档图像二值化性能的去噪声装置和方法制造方法及图纸

技术编号:2925823 阅读:240 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了用于改善文档图像二值化性能的去噪声装置和方法。该去噪声装置包括:灰度图像平滑单元,用于基于字符的笔画方向信息对灰度图像中的噪声点进行平滑,并输出经平滑的灰度图像;灰度图像二值化单元,用于对由所述灰度图像平滑单元输出的经平滑的灰度图像进行二值化,并输出进行了二值化的图像;二值图像噪声去除单元,用于基于字符的笔画宽度来去除由所述灰度图像二值化单元输出的进行了二值化的图像中的噪声点。

【技术实现步骤摘要】

本专利技术涉及一种用于改善文档图像二值化性能的去噪声装置和方 法,更具体地说,涉及一种通过基于字符笔画模型的文档图像平滑方法 以及基于字符笔画宽度估计的二值图像噪声去除方法来改善文档图像二 值化性能的去噪声装置和方法。
技术介绍
文档图像的二值化是文档识别的一个重要步骤。二值化操作的含义 是把通过扫描或拍照得到的数字化文档图像中的像素点分成两个类别 内容和背景。内容包括字符、表格边框等,通常用黑色表示,背景通常 用白色表示。各种二值化算法的原理和性能的评测可以参见M. Sezgin, B. Sanker 在Journal of Electronic Imaging 13(1), 2004的文章"Survey over image thresholding techniques and quantitative performance evaluation "。另夕卜,关 于文档图像的二值化方法也有专利发表,如美国专利6,438,265, A. Heilper, Y. Navon, E. Walach, "Method of binarization in an optical character recognition system ,,。由于取像手段的不同以及图像压縮等原因,文档图像的质量会有所 下降,这将对二值化的结果造成很大的影响。为了提高二值化的效果, 提出了很多不同的二值化算法,这些算法在一定程度上能够有效地抑制 背景噪声等造成的影响。但是,由于图像退化的具体原因和程度各不相同,目前的二值化算法仍然不能完全解决问题。
技术实现思路
鉴于现有技术中存在的问题而提出了本专利技术,本专利技术的目的在于提供一种能够改善文档图像二值化效果,从而提高字符识别的性能的装置 和方法。本专利技术提出的方法与现有技术的方法的区别在于首先,本方法在 二值化操作之前对输入的灰度图像进行灰度级别的平滑,以去除噪声, 而保留笔画信息。其次,本方法在二值化之后,利用二值化的结果来分 析笔画的特征,再进行二值的噪声去除。根据本专利技术的第一方面,提供了一种用于文档图像二值化性能改善 的去噪声装置,该去噪声装置包括灰度图像平滑单元,用于基于字符的笔画方向信息对灰度图像中的 噪声点进行平滑,并输出经平滑的灰度图像;灰度图像二值化单元,用于对由所述灰度图像平滑单元输出的经平 滑的灰度图像进行二值化,并输出进行了二值化的图像;二值图像噪声去除单元,用于基于字符的笔画宽度来去除由所述灰 度图像二值化单元输出的进行了 二值化的图像中的噪声点。根据本专利技术第一方面的用于改善文档图像二值化性能的去噪声装置,其中,所述灰度图像平滑单元包括平滑点选择单元,用于选择需要进行平滑的像素点作为平滑点; 笔画方向判断单元,用于判断所述平滑点所属笔画的方向; 像素点平滑单元,用于利用所述平滑点所属笔画的方向上的邻近像 素点的像素值对所述平滑点进行平滑。根据本专利技术第一方面的用于改善文档图像二值化性能的去噪声装置,其中,其中,所述二值图像噪声去除单元包括笔画宽度估计单元,用于估计笔画的宽度,并将所述笔画的宽度与一阈值进行比较;噪声点去除循环次数计算单元,用于在所述笔画的宽度大于所述阈 值时,计算需要对笔画执行二值噪声点去除操作的循环次数;笔画二值噪声点去除单元,用于根据所述二值噪声点去除操作的循 环次数,反复去除笔画中的噪声点。根据本专利技术的另一方面,提供了一种用于改善文档图像二值化性能的去噪声方法,该方法包括灰度图像平滑步骤,用于基于字符的笔画方向信息对灰度图像中的 噪声点进行平滑,并输出经平滑的灰度图像;灰度图像二值化步骤,用于对所述经平滑的灰度图像进行二值化, 并输出进行了二值化的图像;二值图像噪声去除步骤,用于基于字符的笔画宽度来去除进行了二 值化的图像中的噪声点。根据本专利技术的另一方面,提供了一种计算机程序,该计算机程序在 运行时,使计算机执行以下步骤灰度图像平滑步骤,用于基于字符的笔画方向信息对灰度图像中的 噪声点进行平滑,并输出经平滑的灰度图像;灰度图像二值化步骤,用于对所述经平滑的灰度图像进行二值化,并输出进行了二值化的图像;二值图像噪声去除步骤,用于基于字符的笔画宽度来去除进行了二 值化的图像中的噪声点。根据本专利技术的另一方面,提供了一种计算机程序产品,该计算机程 序产品包括计算机可读存储介质,该计算机可读存储介质中存储有用于 文档图像二值化性能改善的去噪声程序,该去噪声程序在执行时,使得计算机执行以下步骤灰度图像平滑步骤,用于基于字符的笔画方向信息对灰度图像中的噪声点进行平滑,并输出经平滑的灰度图像;灰度图像二值化步骤,用于对所述经平滑的灰度图像进行二值化,并输出进行了二值化的图像;二值图像噪声去除步骤,用于基于字符的笔画宽度来去除进行了二 值化的图像中的噪声点。根据本专利技术,可以在对文档图像进行二值化之前对文档图像进行基 于字符笔画模型的文档图像平滑处理,以使文档图像的背景噪声点得到 平滑,并且在对文档图像进行二值化之后对文档图像进行基于字符笔画 宽度估计的二值图像噪声去除处理,以进一步去除背景噪声点,本专利技术的方法可以与任何现有的二值化方法进行结合,以进一步改善文档图像 二值化后的效果,从而提高字符识别的性能。附图说明所包含的附图用于提供对本专利技术的进一步理解,附图被并入说明书 并构成说明书的一部分,附图说明了本专利技术的实施例,并与说明书一起 用于解释本专利技术的原理。在附图中图1是示意性地表示根据本专利技术的用于改善文档图像二值化性能 的装置的框图;图2是表示根据本专利技术的用于改善文档图像二值化性能的装置的 操作的流程图;图3是表示根据本专利技术的笔画方向判断方法的示意图; 图4是表示根据本专利技术的灰度图像平滑方法的流程图; 图5是表示根据本专利技术的二值图像噪声去除方法的流程图; 图6是表示笔画宽度估计方法的示意图;图7是表示应用本专利技术的方法之前和应用本专利技术的方法之后的效果 的比较示例,其中,A是没有应用本专利技术的方法时的二值化结果,B是 应用了本专利技术的灰度图像平滑方法后的二值化结果,C是应用了本专利技术 的灰度图像平滑方法和二值图像噪声去除方法后的结果。具体实施方式下面将参照附图详细说明根据本专利技术的去噪声装置和方法的实施例。首先将参照图1和图2简要说明根据本专利技术的去噪声装置的总体构 成和操作。图1是示意性地表示根据本专利技术的用于改善文档图像二值化 性能的装置的框图。图2是根据本专利技术的用于改善文档图像二值化性 能的装置的操作的流程图。如图1所示,根据本专利技术的噪声点去除装置300包括灰度图像平滑 单元302、灰度图像二值化单元303以及二值图像噪声去除单元304。如图2所示,在进行操作时,向噪声点去除装置300输入灰度文档图像(步骤S301),灰度图像平滑单元302对该灰度文档图像进行灰度级 别的平滑处理(步骤S302),从而抵消噪声对二值化算法的影响。随后, 灰度图像二值化单元303将进行了平滑处理的灰度图像转化为二值化图 像(步骤S303),在该步骤中可以采用各种现有的二值化算法。对于二值 化图像中残留的噪声,二值图像噪声去除单元304进一步进行噪声的去 除(步骤S304),最后输出去除了噪声以后的二值化图像(步骤S305)。 接下来,将进一步参照图3到图5详细说明根据本专利技术本文档来自技高网...

【技术保护点】
一种用于文档图像二值化性能改善的去噪声装置,该去噪声装置包括:灰度图像平滑单元,用于基于字符的笔画方向信息对灰度图像中的噪声点进行平滑,并输出经平滑的灰度图像;灰度图像二值化单元,用于对由所述灰度图像平滑单元输出的经平滑的灰度图像进行二值化,并输出进行了二值化的图像;二值图像噪声去除单元,用于基于字符的笔画宽度来去除由所述灰度图像二值化单元输出的进行了二值化的图像中的噪声点。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙俊堀田悦伸藤本克仁直井聪
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利