一种鲁棒且高效的扫描文档图像增强方法及其装置制造方法及图纸

技术编号:38901830 阅读:10 留言:0更新日期:2023-09-22 14:20
本发明专利技术提供一种鲁棒且高效的扫描文档图像增强方法及其装置,该方法包括获取待处理的扫描文档图像;使用多级金字塔算法对所述扫描文档图像逐层向下采样,对每一层的数据使用滤波操作进行图像背景信息的提取;基于获取的图像背景信息对所述扫描文档图像进行增强;对增强后的扫描文档图像进行进一步的图像对比度增强,生成文档增强图像。应用本发明专利技术可以适应各种来源和内容的文档图像,并且能够提高图像的清晰度、对比度,从而使扫描文档图像更接近原始文档的图像质量。原始文档的图像质量。原始文档的图像质量。

【技术实现步骤摘要】
一种鲁棒且高效的扫描文档图像增强方法及其装置


[0001]本专利技术涉及图像处理
,具体涉及一种鲁棒且高效的扫描文档图像增强方法以及应用该方法的装置。

技术介绍

[0002]随着数字化学习和办公的普及,越来越多的人们需要将纸质文档或投影文档转换成数字文档。然而,由于扫描过程中可能会受到光照、纸张颜色和纹理等多种因素的影响,扫描得到的文档图像往往存在一些问题,例如模糊、失真、对比度不足等。为了解决这些问题,扫描文档图像增强技术应运而生。
[0003]扫描文档图像增强技术是指通过对扫描得到的文档图像进行后处理,提高扫描文档图像的清晰度、对比度,期望文档图像尽可能的接近原始文档的图像质量。目前已有多种文档图像增强技术被广泛应用,包括基于灰度变换的方法、直方图均衡化的方法、基于自适应滤波器的方法等,这些方法在一定程度上能够改善文档图像的质量,但在实际应用中,由于文档的类型、字体粗细、纹理、扫描环境光源等因素的影响,这些方法往往难以适应多种场景。
[0004]目前的文档图像增强技术虽然能够改善扫描文档图像的质量,但仍存在一些局限性和缺陷:
[0005]首先,目前的扫描文档图像通常涉及多种技术和方法,例如灰度变换、直方图均衡化、边缘检测、形态学操作、二值化、去噪等等,不同的技术和方法有各自的优缺点和适用范围,往往需要根据每张被处理图像的特征和需求进行选择组合,这增加了处理复杂度和难度。其次,这些方法通常针对特定类型或场景的文档图像,难以适应不同来源和内容的文档图像,这使得扫描文档图像增强技术的普适性受到限制。此外这些方法也存在一些局限性和缺陷,例如,效果不稳定、可能错误保留阴影、参数调节复杂等等。
[0006]另外,大多数现有的文档图像质量增强方法都是基于各种特征值的全局或局部的对比度调节技术,包括二值化处理,往往全局对比度调节技术不能消除阴影区域的低对比度问题,而局部对比度调节技术可能导致粗体字出现空洞或颜色不均匀的问题。

技术实现思路

[0007]为了克服现有技术的不足,本专利技术针对以上适应场景少,处理复杂和难度大,效果不稳定等问题,提供一种既能够保证增强效果,又能够保证处理速度的鲁棒且高效的扫描文档图像增强方法及其装置,用来适应各种来源和内容的文档图像,并且能够提高图像的清晰度、对比度,从而使扫描文档图像更接近原始文档的图像质量。
[0008]为解决上述问题,本专利技术所采用的技术方案如下:
[0009]一种鲁棒且高效的扫描文档图像增强方法,包括以下步骤:
[0010]获取待处理的扫描文档图像;
[0011]使用多级金字塔算法对所述扫描文档图像逐层向下采样,对每一层的数据使用滤
波操作进行图像背景信息的提取;
[0012]基于获取的图像背景信息对所述扫描文档图像进行增强;
[0013]对增强后的扫描文档图像进行进一步的图像对比度的增强,生成文档增强图像。
[0014]根据本专利技术提供的一种鲁棒且高效的扫描文档图像增强方法,使用多级金字塔算算法获取图像背景信息时,先逐层下采样,即对当前层输入图像进行低通滤波后抽取偶数列和偶数行的像素,以产生分辨率为输入图像尺寸一半的图像作为当前层输出以及下一层金字塔的输入;在对所述扫描文档图像进行上采样的数据融合过程中,先通过双线性插值或双三次B样条差值在每一层的图像中插入新的像素,使得每一层的输出图像分辨率与原始输入图像的输入图像尺寸一致,然后对所有层的输出图像使用滤波操作进行层间滤波获得图像背景信息。
[0015]根据本专利技术提供的一种鲁棒且高效的扫描文档图像增强方法,使用多级金字塔算法对所述扫描文档图像逐层向下采样之前,根据扫描文档图像的尺度大小进行金字塔层数的计算:
[0016]获取图像的宽width和高height;
[0017]取图像的宽和高中的较大值进行后续的计算;
[0018]将该值除以32;
[0019]求log2;
[0020]向上取整作为最终的金字塔层数;
[0021]可以表示为公式(1):
[0022][0023]根据本专利技术提供的一种鲁棒且高效的扫描文档图像增强方法,所述基于获取的图像背景信息对所述扫描文档图像进行增强,包括:
[0024]使用划分模式对原始的扫描文档图像和背景图像进行运算,得到增强后的扫描文档图像;其中,划分模式是根据基色和混合色之间的比例关系来计算结果色进行调整的,表示为公式(21):
[0025]结果色=clip(基色/混合色
×
255,0,255(21)
[0026]其中,基色为原始的扫描文档图像上的每一个像素值,混合色为背景图像上的每一个像素值,clip表示对计算结果进行截断。
[0027]根据本专利技术提供的一种鲁棒且高效的扫描文档图像增强方法,所述基于获取的图像背景信息对所述扫描文档图像进行增强,包括:
[0028]使用补偿模式对原始的扫描文档图像和背景图像进行计算;其中,通过计算背景图像与文档的背景颜色之间的差异,将差异结果叠加到原始图像上,从而实现背景的增白,表示为公式(22):
[0029]增强图像=clip(原始图像+(255

背景图像),0,255) (22)
[0030]对补偿模式得到的增强图像进行一次归一化操作,表示为公式(23):
[0031]增强图像


[0032]clip((增强图像

min(增强图像))/(255

min(增强图像))
×
255,0,255)(23)。
[0033]根据本专利技术提供的一种鲁棒且高效的扫描文档图像增强方法,所述对增强后的扫描文档图像进行进一步的图像对比度的增强,执行非线性灰度变换以增强其空间对比度,
包括:
[0034]使用伽玛校正对增强后的扫描文档图像进行对比度调整,表示为公式(31):
[0035]增强图像像素=(原始图像像素/255)
gamma
×
255 (31)。
[0036]根据本专利技术提供的一种鲁棒且高效的扫描文档图像增强方法,使用基于自动生成的颜色查找表对增强后的扫描文档图像进行进一步的图像对比度的增强,包括:
[0037]利用大津法或分位数法计算阈值T;
[0038]利用阈值T计算颜色查找表LUT;
[0039]根据颜色查找表LUT对增强后的扫描文档图像进行颜色映射,完成增强。根据本专利技术提供的一种鲁棒且高效的扫描文档图像增强方法,所述利用阈值T计算颜色查找表LUT,表示为公式(32):
[0040][0041]根据本专利技术提供的一种鲁棒且高效的扫描文档图像增强方法,在设备获取待处理的扫描文档图像之后,为提高处理速度减少处理时间,还执行:
[0042]将待处理的扫描文档图像按照预设比例缩小进行图像背景信息的提取;
[0043]在提取到图像背景信息之后本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种鲁棒且高效的扫描文档图像增强方法,其特征在于,包括以下步骤:获取待处理的扫描文档图像;使用多级金字塔算法对所述扫描文档图像逐层向下采样,对每一层的数据使用滤波操作进行图像背景信息的提取;基于获取的图像背景信息对所述扫描文档图像进行增强;对增强后的扫描文档图像进行进一步的图像对比度增强,生成文档增强图像。2.根据权利要求1所述的方法,其特征在于:使用多级金字塔算算法获取图像背景信息时,先逐层下采样,即对当前层输入图像进行低通滤波后抽取偶数列和偶数行的像素,以产生分辨率为输入图像尺寸一半的图像作为当前层输出以及下一层金字塔的输入;在对所述扫描文档图像进行上采样的数据融合过程中,先通过双线性插值或双三次B样条差值在每一层的图像中插入新的像素,使得每一层的输出图像分辨率与原始输入图像的输入图像尺寸一致,然后对所有层的输出图像使用滤波操作进行层间滤波获得图像背景信息。3.根据权利要求1所述的方法,其特征在于:使用多级金字塔算法对所述扫描文档图像逐层向下采样之前,根据扫描文档图像的尺度大小进行金字塔层数的计算:获取图像的宽width和高height;取图像的宽和高中的较大值进行后续的计算;将该值除以32;求log2;向上取整作为最终的金字塔层数;可以表示为公式(1):4.根据权利要求1所述的方法,其特征在于,所述基于获取的图像背景信息对所述扫描文档图像进行增强,包括:使用划分模式对原始的扫描文档图像和背景图像进行运算,得到增强后的扫描文档图像;其中,划分模式是根据基色和混合色之间的比例关系来计算结果色进行调整的,表示为公式(21):结果色=clip(基色/混合色
×
255,0,255(21)其中,基色为原始的扫描文档图像上的每一个像素值,混合色为背景图像上的每一个像素值,clip表示对计算结果进行截断。5.根据权利要求1所述的方法,其特征在于,所述基于获取的图像背景信息对所述扫描文档图像进行增强,包括:使用补偿模式对原始的扫描文档图像和背景图像进行计算...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:珠海移科智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1