【技术实现步骤摘要】
一种基于深度学习的档案扫描图像自动纠偏裁边方法
[0001]本专利技术涉及档案扫描图像自动纠偏裁边
,尤其涉及一种基于深度学习的档案扫描图像自动纠偏裁边方法。
技术介绍
[0002]在现代社会,数字化已经成为信息处理的主要方式,各类文档的数字化处理也越来越普遍。在进行档案扫描时,由于扫描仪摆放不当或者档案未被平整放置等原因,导致扫描图像存在扭曲、倾斜、缺角等问题。这些问题会对后续文档识别、分类、检索和浏览等产生严重影响。因此,对于档案扫描图像的自动纠偏和裁边处理成为数字化档案处理中的重要环节。
[0003]目前,已经有许多方法用于解决文档纠偏裁边问题。其中,传统的基于角点检测的方法利用图像的几何形状特征进行纠偏,但是对于一些文档图像存在噪声、阴影等情况时会出现较大误差。此外,基于边缘检测的方法利用图像边缘信息进行纠偏。近年来,深度学习技术的发展使得文档纠偏的效果有了显著提高。其中,基于卷积神经网络(CNN)的文档纠偏方法得到了广泛应用。例如,通过构建CNN模型进行文档自适应纠偏,该方法通过学习文档中的结构信息实现自适应纠偏,但是对于一些文档扭曲角度较小的情况会存在纠偏不准确的问题。此外,另一种基于CNN的文档纠偏方法则是通过学习文档的特征点和边界信息,实现文档的纠偏和裁剪,但是对于文档存在多余边框的情况处理效果不佳。
[0004]虽然现有的文档纠偏方法取得了一定的效果,但是在一些并不扭曲、不缺角、偏移角度很小或者几乎不偏移的但需要去除多余边框的档案扫描图像上取得精确的效果仍然是一个挑战。这是因为 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的档案扫描图像自动纠偏裁边方法,其特征在于,包括以下步骤:S11、对输入的档案扫描图像进行预处理,包括:1)图像边缘裁切、2)调整图像大小、3)合成数据集、4)数据集分组,以满足模型对输入数据集的要求;S12、将处理好的档案扫描图像数据集放入角度校正和边缘切割网络模型中进行训练,该模型对输入图像进行特征提取;S13、采用ACMCN模型先自动检测图像中的边缘,并根据边缘位置进行自动纠偏处理,再自动检测图像中的内容,并根据内容位置进行自动裁边处理,以去除多余的边缘部分;S14、处理好的图像此时将被判断是否已经符合设定的纠偏裁边要求,即处理好的档案扫描图像中的所有直线的平均角度偏差值在[0
°
,1
°
]之间,所有边缘的边缘模糊度的值在[0,0.1]之间,若满足该要求,则输出处理好的图像;若不满足该要求,则继续迭代进行纠偏裁边处理,直到满足要求后输出处理好的图像;S15、利用训练得到的模型处理档案扫描图像并输出经过自动纠偏裁边处理后的档案扫描图像。2.根据权利要求1所述的一种基于深度学习的档案扫描图像自动纠偏裁边方法,其特征在于,在步骤S11中,所述1):图像边缘裁切指先读取n张0度偏斜的已基本裁切好的原始图片,若原始图片不为0度,则手工纠偏为0度;然后进行下一轮的裁切操作,将图像上下左右各裁切掉60个像素以裁掉文档边缘的杂色,并生成新的图像数据集;所述2):调整图像大小指将新的图像数据集的所有图像的高度像素设置为480dpi,同时图像的宽度像素根据相应比例进行调整,从而使图像大小统一化,并生成新的图像数据集;所述3):合成数据集指将新的图像数据集分别取75%进行垂直翻转和水平翻转的操作,同时选取50%的图像进行旋转的操作,其中旋转角度在区间[
‑
90
°
,90
°
)之间取任意值,接着对所有图像进行压缩增强,指定压缩后的图像质量下限为30JFIF,上限为80JFIF,并选取70%的图像进行随机阴影增强,其中指定阴影可能出现区域为整张图像,阴影数量下限为0,上限为1;然后选取50%的图片进行随机亮度和对比度增强,其中指定对比度调整的幅度范围在0.1到0.34之间,指定图像亮度降低50%;最后选取z张档案扫描图像常见的背景图片与n张处理后的图像进行随机合成,并生成最后的数据集;所述4):数据集分组指将最后的数据集按6张图片一组,每组抽取1张图片作为验证集,另外5张图片作为训练集,进而将最后的数据集分成训练集和验证集两个部分。3.根据权利要求1所述的一种基于深度学习的档案扫描图像自动纠偏裁边方法,其特征在于,在步骤S12中,所述角度校正和边缘切割网络模型包括:a)特征提取模块、b)纠偏模块、c)裁边模块;具体架构如下:a)特征提取模块的网络深度为16层,该网络包含5个卷积层、3个全连接层和8个非线性激活层,其中每个非线性激活层都使用ReLU激活函数,该网络在每个全连接层后都使用了dropout层以防止过拟合,丢弃率分别为0.4、0.3和0.25,并使用softmax激活函数进行最终分类;b)纠偏模块的网络深度为9层,该网络包含4个卷积层、4个池化层和1个全连接层,其中每个卷积层的卷积核大小为3
×
3,卷积核个数依次为32、64、128和256,每个池化层的池...
【专利技术属性】
技术研发人员:孙强,吉红慧,陈逸彬,蒋行健,曹张华,邵蔚,黄勋,
申请(专利权)人:南通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。