一种扫描文档的裁边方法与系统技术方案

技术编号:23933810 阅读:40 留言:0更新日期:2020-04-25 02:25
本发明专利技术公开了一种扫描文档的裁边方法与系统,以解决扫描文档的裁边效率低的问题。方法包括:把扫描得文件转换为图片格式,对图片进行灰度化,并使用改进的Canny算子提取边缘,找到边缘的最小面积包围矩形,并且计算矩形的中心,以及旋转的角度。对原始图片以矩形的中心旋转相应的角度,得到无倾斜的图片。对无倾斜图片二值化,得到矩形的边缘点,找到最小包围矩形,以最小包围矩形裁剪图片,得到裁边之后的图片文档。同时计算矩形的面积,用于判断是否裁剪失败,如果矩形面积与标准纸张的面积差别大于2%,判定为裁剪失败,进行人工手动裁剪。本发明专利技术提高了扫描文件切边的效率,并且能够尽可能多地鉴别出切边失败的文件,提高扫描切边文件的准确性。

A method and system of edge cutting for scanning documents

【技术实现步骤摘要】
一种扫描文档的裁边方法与系统
本专利技术涉及图像处理领域,具体涉及一种扫描文档的裁边技术。
技术介绍
在当今社会,纸质资料的弊端逐渐显现。纸质材料的存储需要占用大量的空间,纸质材料在储存过程中容易受到环境因素的影响,造成不同程度的损坏。这些问题都给纸质材料的完整性带来巨大的威胁。并且在查阅的时候是非常费时费力的。传统方法为了更完整的保存纸质材料需要投入巨大的财力、物力去建造专门的存放场所,并且要配备专业的人员对场所进行维护与管理。与纸质材料的存储与管理相比,电子材料在存储空间上表现出相当大的优越性。电子材料一般存储在硬盘与云端。这样也就免去了建造专门的场所、雇佣专业的管理人员的麻烦。为了将一些纸质资料转化为电子资料,一般先使用扫描仪对纸质材料进行扫描,然后对生成的电子文件进行保存。扫描仪在对被扫描文件自动生成电子文件的同时会在电子文件外围添加一周的外框(白边),大部分时间我们只得到扫描文件而不需要添加外框。这个时候人们就会手动去裁剪电子文件的尺寸大小。这样做不仅费时费力并且效率和准确率都很难让人满意。
技术实现思路
鉴于上面提及的问题,提出了一种扫描文档的裁边方法为了克服或者部分的解决上述问题。根据本专利技术的一个方面,提出了一种扫描文档的裁边方法,包括:针对扫描得到的电子文件,将其转换为图片格式的文件;利用灰度变换把彩色图像变为灰度图像;对灰度图进行轮廓检测,由于扫描得到的图像整体偏亮,对比度不高。因此图像中存在弱边缘,虽然人眼能够观察到弱边缘的存在,但对图像作边缘检测时,会导致将弱边缘划分成非边缘,得到的边缘图像可能有间断,甚至会漏检一些倾斜的边缘。因此,在作边缘检测时为了更好地检测出图像中的弱边缘,提出了一种基于Canny的弱边缘检测改进算法。改进的Canny算法流程图如图1所示。每一幅图像在拍摄的时候,都会不可避免的受到噪声的干扰。为了去除噪声并且尽可能多的保留边缘信息,增强边缘,使用双边滤波去噪。g(i,j)代表输出点的灰度值,f(k,l)代表输入点的灰度值,S(i,j)是指以(i,j)为中心的(2N+1)*(2N+1)的大小的范围,N代表(i,j)的邻域半径。加权系数ω(i,j,k,l)是空域核与值域核的乘积,ωd为空间距离高斯函数:ωr为像素值相似度高斯函数:其中(i,j)为输出点位置,(k,l)为输入点的位置,为空间域标准差,为值域标准差。由上式可知,当图像在灰度变化平缓的区域时,邻域中的像素值相差不大。此时ωr无限接近于1。此时的双边滤波就是普通的高斯滤波,达到对图像平滑的效果。当图像在变化程度剧烈的区域,比如在边缘区域时,邻域中的像素值相差很大。此时ωr趋近0,颜色差值越大,wr越逼近0,最终整个式子的值逼近于0。最终的结果是权值为0。因此在最终计算时,该处将不影响输出值。通过此种方式,既能平滑图像,又保持了图像的边缘。由于扫描文件会存在一定的倾斜,因此边缘也会倾斜。因此要想更好的检测到倾斜的边缘就要对锐化滤波器进行改进。改进的滤波器如图4所示。G1(x,y)=max(|2f(x+1,y-1)+f(x+1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x-1,y)-2f(x-1,y+1)-f(x,y)|)G1(x,y)是通过计算滤波器对应位置的像素灰度值的加权和,然后取较大的值为正27度的梯度值。G2(x,y)=max(|2f(x-1,y-1)+f(x-1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x+1,y)-2f(x+1,y+1)-f(x,y)|)G2(x,y)是通过计算滤波器对应位置的像素灰度值的加权和,然后取较大的值为153度的梯度值。为了快速的计算总的梯度,取总梯度大小大小为:G=|G1|+|G2|分别用传统的Canny算子和改进的Canny算子计算图像每个像素点的梯度值,取两种算法的最大值为该像素点的梯度值。设传统Canny算子的梯度值为Gold,改进算子的梯度值为Gnew,最后的的梯度值为Gmax。Gmax=max(Gold,Gnew)传统的滤波器只考虑2个方向,即水平、垂直方向。改进后的滤波器细化了边缘检测方向,可扩展到4个边缘方向,即水平、27度、垂直和153度方向。对得到的梯度图使用OTSU方法进行阈值分割。选择一个初始阈值T,将图像分割成前景和背景。计算前景和背景的灰度值方差,通过迭代的方法得到最大的方差值,最大的方差值对应的阈值Tm可以使前景和背景分割的误差率最小。将Tm设置为Canny算法的高阈值,令低阈值Td=0.9Tm。凡是大于高阈值的归为强边缘,小于低阈值的不是边缘,大于低阈值小于高阈值的归为弱边缘,如果弱边缘像素的邻接像素有大于高阈值,则把弱边缘归为强边缘。经过Canny算子对输入图像进行运算后就得到了,输入图像的边缘图像。寻找边缘图像的的最小面积外接矩形,把它作为感兴趣区域,即为带有旋转角度的矩形。由于感兴趣区域存在一定角度的旋转,因此需要先寻找感兴趣区域的中心,以及感兴趣区域旋转的角度,通过构造旋转矩阵,进而把图像以感兴趣区域中心旋转一定的角度适合人们观察,假设此时适合人们观察的图像名为dst。接下来就是对dst图像进行切边。对dst图像,使用最大类间方差阈值分割法进行二值化分割,得到二值化图像。找到二值化图像的边缘点,把边缘点组成一个序列,然后循环序列中的每一个边缘点找到二值化图像边缘的最小外接矩形,此时外接矩形是没有旋转角度的。最后以外接矩形的大小去裁剪dst,输出的图像out即为切边后的图像。根据本专利技术的另一方面,提供了一种文档裁边的系统,即客户端。客户端包括:文件批量读取模块,能够将一个文件夹内的多个扫描文件读取到客户端中。错误切边标记模块,能够识别切边错误的文档,并且标记出来,可以使用人工手动修改。文件保存模块,可以将处理后的图像保存到本地。根据本专利技术可以批量的处理扫描文件,解决了人工裁剪大量扫描文件效率低的问题。并且,由于本专利技术可以自动识别出裁切错误的文件,因此能够尽可能多地提高裁切扫描文件的准确性。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,以下特举本专利技术的具体实施方式。附图说明图1示出了本专利技术改进的Canny边缘检测方法的流程图;图2示出了本专利技术实施例的一种扫描文档的裁边方法的流程图;图3示出了本专利技术实施例的一种扫描文档的裁边方法与系统的结构框图。图4示出了根据本专利技术所设计的滤波器的图。具体实施方式下面将参照附图更详细地描述本专利技术的示例的具体实施方式。虽然附图中显示了本专利技术的示例实施,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制本文档来自技高网...

【技术保护点】
1.根据本专利技术的一个方面,提出了一种扫描文档的裁边方法,包括:针对扫描得到的电子文件,将其转换为图片格式的文件;利用灰度变换把彩色图像变为灰度图像;对灰度图运用改进的Canny边缘检测算法进行轮廓检测;对得到的轮廓图像进行旋转,改善图像的观察角度;改善后的图像再次获取,边缘轮廓,并以轮廓图的大小裁剪图像。/n

【技术特征摘要】
1.根据本发明的一个方面,提出了一种扫描文档的裁边方法,包括:针对扫描得到的电子文件,将其转换为图片格式的文件;利用灰度变换把彩色图像变为灰度图像;对灰度图运用改进的Canny边缘检测算法进行轮廓检测;对得到的轮廓图像进行旋转,改善图像的观察角度;改善后的图像再次获取,边缘轮廓,并以轮廓图的大小裁剪图像。


2.据权利要求1所述的方法,由于扫描得到的图像整体偏亮,对比度不高,因此图像中存在弱边缘,虽然人眼能够观察到弱边缘的存在,但对图像作边缘检测时,会导致将弱边缘划分成非边缘,得到的边缘图像可能有间断,甚至会漏检一些倾斜的边缘,因此,在作边缘检测时为了更好地检测出图像中的弱边缘,提出了一种基于Canny的弱边缘检测改进算法。


3.据权利要求2所述的方法,改进的Canny算法原理如下,每一幅图像在拍摄的时候,都会不可避免的受到噪声的干扰。为了去除噪声并且尽可能多的保留边缘信息,增强边缘,使用双边滤波去噪:



g(i,j)代表输出点的灰度值,f(k,l)代表输入点的灰度值,S(i,j)是指以(i,j)为中心的(2N+1)*(2N+1)的大小的范围,N代表(i,j)的邻域半径,加权系数ω(i,k,j,l)是空域核与值域核的乘积,ωd为空间距离高斯函数:



ωr为像素值相似度高斯函数:






其中(i,j)为输出点位置,(k,l)为输入点的位置,δd为空间域标准差,δr为值域标准差,
由上式可知,当图像在灰度变化平缓的区域时,邻域中的像素值相差不大,此时ωr无限接近于1,此时的双边滤波就是普通的高斯滤波,达到对图像平滑的效果,当图像在变化程度剧烈的区域,比如在边缘区域时,邻域中的像素值相差很大,此时ωr趋近0,颜色差值越大,wr越逼近0,最终整个式子的值逼近于0,最终的结果是权值为0,因此在最终计算时,该处将不影响输出值,通过此种方式,既能平滑图像,又保持了图像的边缘。


4.据权利要求2所述的方法,由于扫描文件会存在一定的倾斜,因此边缘也会倾斜,因此要想更好的检测到倾斜的边缘就要对锐化滤波器进行改进:
G1(x,y)=max(|2f(x+1,y-1)+f(x+1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x-1,y)-2f(x-1,y+1)-f(x,y)|)
G1(x,y)是通过计算滤波器对应位置的像素灰度值的加权和,然后取较大的值为正27度左右的梯度值:
G2(x,y)=max(|2f(x-1,y-1)+f(x-1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x+1,y)-2f(x+1,y+1)-f(x,y)|)
G2(x,y)是通过计算滤波器对应位置的像素灰度值的加权和,然后取较大的值为153度左右的梯度值,为了快速的计算总的梯度,取总梯度大小大小为:
G=|G1|+|G2|。


5...

【专利技术属性】
技术研发人员:李子印王启真孔繁圣邹细勇杨凯陈亮
申请(专利权)人:中国计量大学上虞高等研究院有限公司中国计量大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1