一种扫描文档的裁边方法与系统技术方案

技术编号：23933810 阅读：40 留言：0更新日期：2020-04-25 02:25

本发明专利技术公开了一种扫描文档的裁边方法与系统，以解决扫描文档的裁边效率低的问题。方法包括：把扫描得文件转换为图片格式，对图片进行灰度化，并使用改进的Canny算子提取边缘，找到边缘的最小面积包围矩形，并且计算矩形的中心，以及旋转的角度。对原始图片以矩形的中心旋转相应的角度，得到无倾斜的图片。对无倾斜图片二值化，得到矩形的边缘点，找到最小包围矩形，以最小包围矩形裁剪图片，得到裁边之后的图片文档。同时计算矩形的面积，用于判断是否裁剪失败，如果矩形面积与标准纸张的面积差别大于2％，判定为裁剪失败，进行人工手动裁剪。本发明专利技术提高了扫描文件切边的效率，并且能够尽可能多地鉴别出切边失败的文件，提高扫描切边文件的准确性。

A method and system of edge cutting for scanning documents

全部详细技术资料下载

【技术实现步骤摘要】
一种扫描文档的裁边方法与系统
本专利技术涉及图像处理领域，具体涉及一种扫描文档的裁边技术。
技术介绍
在当今社会，纸质资料的弊端逐渐显现。纸质材料的存储需要占用大量的空间，纸质材料在储存过程中容易受到环境因素的影响,造成不同程度的损坏。这些问题都给纸质材料的完整性带来巨大的威胁。并且在查阅的时候是非常费时费力的。传统方法为了更完整的保存纸质材料需要投入巨大的财力、物力去建造专门的存放场所，并且要配备专业的人员对场所进行维护与管理。与纸质材料的存储与管理相比，电子材料在存储空间上表现出相当大的优越性。电子材料一般存储在硬盘与云端。这样也就免去了建造专门的场所、雇佣专业的管理人员的麻烦。为了将一些纸质资料转化为电子资料，一般先使用扫描仪对纸质材料进行扫描，然后对生成的电子文件进行保存。扫描仪在对被扫描文件自动生成电子文件的同时会在电子文件外围添加一周的外框(白边)，大部分时间我们只得到扫描文件而不需要添加外框。这个时候人们就会手动去裁剪电子文件的尺寸大小。这样做不仅费时费力并且效率和准确率都很难让人满意。
技术实现思路
鉴于上面提及的问题，提出了一种扫描文档的裁边方法为了克服或者部分的解决上述问题。根据本专利技术的一个方面，提出了一种扫描文档的裁边方法，包括：针对扫描得到的电子文件，将其转换为图片格式的文件；利用灰度变换把彩色图像变为灰度图像；对灰度图进行轮廓检测，由于扫描得到的图像整体偏亮，对比度不高。因此图像中存在弱边缘，虽然人眼能够观察到弱...

【技术保护点】
1.根据本专利技术的一个方面，提出了一种扫描文档的裁边方法，包括：针对扫描得到的电子文件，将其转换为图片格式的文件；利用灰度变换把彩色图像变为灰度图像；对灰度图运用改进的Canny边缘检测算法进行轮廓检测；对得到的轮廓图像进行旋转，改善图像的观察角度；改善后的图像再次获取，边缘轮廓，并以轮廓图的大小裁剪图像。/n

【技术特征摘要】
1.根据本发明的一个方面，提出了一种扫描文档的裁边方法，包括：针对扫描得到的电子文件，将其转换为图片格式的文件；利用灰度变换把彩色图像变为灰度图像；对灰度图运用改进的Canny边缘检测算法进行轮廓检测；对得到的轮廓图像进行旋转，改善图像的观察角度；改善后的图像再次获取，边缘轮廓，并以轮廓图的大小裁剪图像。

2.据权利要求1所述的方法，由于扫描得到的图像整体偏亮，对比度不高，因此图像中存在弱边缘，虽然人眼能够观察到弱边缘的存在，但对图像作边缘检测时，会导致将弱边缘划分成非边缘，得到的边缘图像可能有间断，甚至会漏检一些倾斜的边缘，因此，在作边缘检测时为了更好地检测出图像中的弱边缘,提出了一种基于Canny的弱边缘检测改进算法。

3.据权利要求2所述的方法，改进的Canny算法原理如下，每一幅图像在拍摄的时候，都会不可避免的受到噪声的干扰。为了去除噪声并且尽可能多的保留边缘信息，增强边缘，使用双边滤波去噪：

g(i,j)代表输出点的灰度值，f(k,l)代表输入点的灰度值,S(i,j)是指以(i，j)为中心的(2N+1)*(2N+1)的大小的范围，N代表(i,j)的邻域半径，加权系数ω(i,k,j,l)是空域核与值域核的乘积，ωd为空间距离高斯函数：

ωr为像素值相似度高斯函数：

其中(i,j)为输出点位置，(k,l)为输入点的位置,δd为空间域标准差，δr为值域标准差，
由上式可知，当图像在灰度变化平缓的区域时，邻域中的像素值相差不大，此时ωr无限接近于1，此时的双边滤波就是普通的高斯滤波，达到对图像平滑的效果，当图像在变化程度剧烈的区域，比如在边缘区域时，邻域中的像素值相差很大，此时ωr趋近0，颜色差值越大，wr越逼近0，最终整个式子的值逼近于0，最终的结果是权值为0，因此在最终计算时，该处将不影响输出值，通过此种方式，既能平滑图像，又保持了图像的边缘。

4.据权利要求2所述的方法，由于扫描文件会存在一定的倾斜，因此边缘也会倾斜，因此要想更好的检测到倾斜的边缘就要对锐化滤波器进行改进：
G1(x,y)＝max(|2f(x+1,y-1)+f(x+1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x-1,y)-2f(x-1,y+1)-f(x,y)|)
G1(x,y)是通过计算滤波器对应位置的像素灰度值的加权和，然后取较大的值为正27度左右的梯度值：
G2(x,y)＝max(|2f(x-1,y-1)+f(x-1,y)-2f(x,y+1)-f(x,y)|,|2f(x,y-1)+f(x+1,y)-2f(x+1,y+1)-f(x,y)|)
G2(x,y)是通过计算滤波器对应位置的像素灰度值的加权和，然后取较大的值为153度左右的梯度值，为了快速的计算总的梯度，取总梯度大小大小为：
G＝|G1|+|G2|。

5...

【专利技术属性】
技术研发人员：李子印，王启真，孔繁圣，邹细勇，杨凯，陈亮，
申请(专利权)人：中国计量大学上虞高等研究院有限公司，中国计量大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人