扫描文档质量提升方法、装置、存储介质及设备制造方法及图纸

技术编号:40090480 阅读:23 留言:0更新日期:2024-01-23 16:07
本发明专利技术公开一种扫描文档质量提升方法、装置、存储介质及设备,方法包括:构建数据库,数据库中包括有多种具有不同纹理图案的第一文档图像,不同纹理图案的第一文档图像具有不同的第一特征向量和与不同的二值化算法关联;从待二值化的第二文档图像中裁剪包含有纹理图案且固定大小的取样窗口,并构建取样窗口的第二特征向量;基于欧几里德距离查找与第二特征向量距离在阈值范围的多对第一特征向量,并经二次比较后选择距离最小的第一特征向量关联的第一文档图像,并选择与其关联的二值化算法对第二文档图像进行二值化。本发明专利技术基于第二文档图像的纹理特征来自动选择合适的二值化算法,大大减小了扫描文档在二值化过程中的方案选择时间。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种扫描文档质量提升方法、装置、存储介质及设备


技术介绍

1、对扫描保存的文档进行二值化处理是一项重要的图像增强手段。文档二值化后,具有以下优点:

2、提高可读性:二值化处理可以将文档转换为黑白图像,去除了彩色和灰度信息,使得文本和图像更加清晰和易于阅读;消除背景噪声:扫描文档时,可能会受到背景噪声的干扰,如纸张纹理、扫描仪噪声等。二值化处理可以将背景噪声转换为纯黑色或纯白色,从而使得文档内容更加突出。便于后续处理:二值化处理可以将文档转换为二值图像,使得后续的图像处理任务更加简化和高效,如文字识别、图像分割等。减少文件大小:二值化处理可以将彩色或灰度图像转换为黑白图像,从而减少文件的大小,节省存储空间。

3、当中,对扫描文档二值化处理的手段有很多中,常用的是利用各种二值化算法对图像进行处理,但由于在专业的档案存档中,需要处理的文档数量非常大,工作人员无法一一为文档图像选择合适的二值化手段,导致文档的二值化处理质量参差不齐。或在选择合适的二值化算法时耗费过多时间,导致工作效率低下。


<本文档来自技高网...

【技术保护点】

1.一种扫描文档质量提升方法,其特征在于,所述提升方法包括:

2.根据权利要求1所述的扫描文档质量提升方法,其特征在于,所述第一特征向量和所述第二特征向量中包括有统计数据,所述统计数据至少包括平均值、标准差、众数、最小值、最大值、中位数和峰度。

3.根据权利要求1所述的扫描文档质量提升方法,其特征在于,在所述数据库的多个所述第一文档图像中,还具有不同前后干扰的强度、墨水颜色、笔的种类、打印方法的多种所述第一文档图像。

4.根据权利要求1所述的扫描文档质量提升方法,其特征在于,所述二值化算法的基础框架包括以下的一种:

5.根据权利要求1所述的...

【技术特征摘要】

1.一种扫描文档质量提升方法,其特征在于,所述提升方法包括:

2.根据权利要求1所述的扫描文档质量提升方法,其特征在于,所述第一特征向量和所述第二特征向量中包括有统计数据,所述统计数据至少包括平均值、标准差、众数、最小值、最大值、中位数和峰度。

3.根据权利要求1所述的扫描文档质量提升方法,其特征在于,在所述数据库的多个所述第一文档图像中,还具有不同前后干扰的强度、墨水颜色、笔的种类、打印方法的多种所述第一文档图像。

4.根据权利要求1所述的扫描文档质量提升方法,其特征在于,所述二值化算法的基础框架包括以下的一种:

5.根据权利要求1所述的扫描文档质量提升方法,其特征在于,在将不同纹理图案的所述第一文档图像与不同的二...

【专利技术属性】
技术研发人员:黄苑玲许广增郭广磊
申请(专利权)人:深圳市深档数码技术有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1