一种从数码照片中快速自动提取矩形扫描件的方法技术

技术编号:20390654 阅读:28 留言:0更新日期:2019-02-20 03:09
本发明专利技术涉及一种从数码照片中快速自动提取矩形扫描件的方法,包括以下步骤:1)数据降采样及灰度变换;2)图像滤噪及边缘检测;3)等值线跟踪检测最大轮廓线;4)轮廓简化及凸包角点检测;5)区域剪裁及透视变形纠正。发明专利技术有益的效果是:本发明专利技术的从普通数码照片中快速自动提取矩形扫描件的方法,对拍照环境、拍摄条件无特殊要求,处理过程无需人工干预,抗噪声,计算速度快,效率高,且处理后的数字存档件占用空间小,便于保存及信息交换。以本发明专利技术为核心的系统,可用于快速自动处理普通数码相机照片,或扫描仪等设备的扫描图像,也可以直接安装于手机等智能设备,实时处理文档资料。

【技术实现步骤摘要】
一种从数码照片中快速自动提取矩形扫描件的方法
本专利技术涉及一种数字图像处理
,尤其是一种从数码照片中快速自动提取矩形扫描件的方法。
技术介绍
相较于将各类资料(如,纸质文档、发票、卡片、传单等)用扫描仪扫描后数字化保存,使用普通数码相机(含手机相机等)采集(数字化)这些信息,用于存档、传递或共享也更便捷高效。但是,用普通数字相机(拍摄)采集存档资料存在几个主要问题:一、目标范围与(成像)采集范围不一致,二、易受环境光照影响,三、所采集的资料存在形变,四、采集的图像数据量大(像素尺寸为百万或千万量级,以jpeg方式压缩后的文件通常为数MB),不便于保存或处理。考虑到资料通常具有矩形外框,现有技术针对扫描件矩形检测的方法通常是利用Hough变换检测直线,再利用直线的水平及垂直方向特征,检测矩形。从输入图像中提取边缘像素;采用霍夫变换从边缘像素提取直线,再选择由多条直线中两两大致正交的四条直线构成的矩形区域。其主要不足是,未考虑普通相机的成像条件,方法效率较低,难以处理资料物的旋转以及透视形变等。现有的透视变形纠正技术,主要依据平面图像的矩形边界的全部或局部、平面图像中的框线、文字行、列等能标示透视变形特征的信息,检测确定透视变形参数,并加以矫正。从输入的文档图像中提取近水平、垂直的直线,利用投票机制确定近似平行线组的灭点,进而计算出透视变换关系。其主要不足是,直线检测效率较低,且对局部形变或非透视形变不适用。
技术实现思路
本专利技术要解决上述现有技术的缺点,提供一种高效处理普通数字相机在自然环境条件下,拍照(扫描)存档具有矩形外框的文档资料的自动化处理方法。本专利技术可降低各类光照环境对成像结果的影响,适用范围广;以角点检测代替常规方法中的直线检测求解候选矩形区域;无效区域自动裁剪,减少数据存贮量。本专利技术解决其技术问题采用的技术方案:这种从数码照片中快速自动提取矩形扫描件的方法,包括以下步骤:1)数据降采样及灰度变换;2)图像滤噪及边缘检测;3)等值线跟踪检测最大轮廓线;4)轮廓简化及凸包角点检测;5)区域剪裁及透视变形纠正。作为优选,所述数据降采样采用等比例缩小的方式。作为优选,所述等值线跟踪基于像素的八邻域,从最外边缘起始点开始,按逆时针方向依次将其邻域内的邻接点加入到所跟踪的边缘点集中,迭代进行到没有新的边缘点加入为止,如果所跟踪的边缘长度大于整个图像周长的一半,则停止搜索其他边缘信息,即以此作为所跟踪的候选矩形轮廓线。作为优选,凸包角点检测采用2D平面点集的扫描法。作为优选,区域剪裁及透视变形纠正的步骤包括,首先选择出区域顶点,计算对应矩形的同名顶点,根据候选区域顶点与矩形顶点的对应关系,计算出变换矩阵,从而可将所选择的候选区域映射到对应的矩形区域,原图像中的透视变形,在映射过程中得以纠正。专利技术有益的效果是:本专利技术的从普通数码照片中快速自动提取矩形扫描件的方法,对拍照环境、拍摄条件无特殊要求,处理过程无需人工干预,抗噪声(鲁棒),计算速度快,效率高,且处理后的数字存档件占用空间小,便于保存及信息交换。以本专利技术为核心的系统,可用于快速自动处理普通数码相机照片,或扫描仪等设备的扫描图像,也可以直接安装于手机等智能设备,实时处理文档资料。附图说明图1是本专利技术的方法处理流程图;图2是折线简化RDP(Ramer-Douglas-Peucker)算法示意图;图3是区域剪裁及变形纠正示意图;图4是普通手机在弱光照环境下拍摄的纸质文件(数码照片);图5是图像灰度变换及拉伸结果;图6是图像边缘提取并精化后的结果;图7是纸质文件(数码照片)提取及纠正结果。具体实施方式下面结合附图对本专利技术作进一步说明:实施例:本专利技术用于从数码照片中快速、自动提取矩形扫描文件的方法,适用于普通数码相机或手机等,在各类自然环境(光照)条件下采集的图像。主要步骤包括,1)数据降采样及灰度变换;2)图像滤噪及边缘检测;3)等值线跟踪检测最大轮廓线;4)轮廓简化及凸包角点检测;5)区域剪裁及透视变形纠正。图1给出本方法的主要步骤及处理流程:1)数据降采样及灰度变换:由于数码照片(数字图像)数据量大(采样点多,通常大于四百万像素),色彩丰富(通常为24位三彩色成像),需要对数据进行预处理,以提升计算性能。本专利技术降采样则采用等比例缩小的方式,即,保持图像的长宽比。缩放比例尺根据输入图像的尺寸,一般选择在1/6~1/2之间(输入图像越大,比例尺s越小)。采样过程可使用双线性、三次卷积等方法;考虑计算效率,也可以利用最近点方法(nearestneighbor)完成降采样过程,即:Xdst=sXsrc其中,s为缩放系数,(图像空间),Xsrc表示源像素,Xdst表示目标像素。灰度变换则将图像由RGB三彩色空间变换到亮度空间Y:Y←0.299·R+0.587·G+0.114·B其中,RGB为图像像素的三个颜色分量,红(red)、绿(green)、蓝(blue)。考虑到图像采集环境(成像条件)复杂(光照及反射环境等),为提升本专利技术方法的广泛适应性,对图像进行灰度拉升,以提升方法的鲁棒性及处理结果的准确性。灰度变换采用线性变换,将图像实际的灰度范围映射到标准灰度范围[0.0,1.0]或[0,255]。变换公式如下:Ydst=α*Ysrc+β,其中,α=255÷(max(Ysrc)–min(Ysrc)),β=0-α*min(Ysrc))(注:如果灰度范围为[0.0,1.0],则将公式中的255修改为1.0),Ysrc表示源像素灰度值,Ydst表示目标像素的灰度值。2)图像滤噪及边缘检测:图像滤噪的主要目的是提高边缘检测的准确性。滤波可采用的各类常见的图像平滑算法,如均值滤波、中值滤波等。以下以5×5高斯核(σ=1)为例简要说明。根据高斯核函数可计算出卷积模板(整数值):以此模板对灰度变换后的图像进行卷积,可在滤除高频噪声的同时,较好地保留边缘特征。边缘检测常基于图像的一阶导数、二阶导数或梯度等信息。本专利技术使用Canny算子检测边缘,考虑图像经过灰度变换(拉伸),其上下阈值分别设置为灰度范围的3/8,6/8(对8位灰度图像,其值为96,192)。3)等值线跟踪及最大轮廓线提取:前一步骤中检测出的边缘信息含有噪声,且连通性相对较差(非连续的短边缘),在进行等值线跟踪之前,需要进行精化。其处理步骤是先进行形态学膨胀,连接不连续的邻接边缘,再进行腐蚀操作,对边缘进行细化(本专利技术中采用3×3方形结构元素,也可使用其他结构元素)。边界跟踪基于像素的八邻域,从最外边缘起始点开始,依次将其邻域内(逆时针方向)的邻接点加入到所跟踪的边缘点集中,迭代进行到没有新的边缘点加入为止。如果所跟踪的边缘长度(以像素为单位)大于整个图像周长(即,2倍的图像宽高和)的一半,则停止搜索其他边缘信息,即,以此作为所跟踪(检测)的候选矩形轮廓线。4)轮廓简化及凸包角点计算:当提取出初始轮廓边界后,需要规则化或简化,以表示真实的轮廓。Ramer-Douglas-Peucker算法,或称Douglas-Pecuker算法(RDP/DP),是常用的折线简化算法,其过程是用给定的点到线的距离(阈值,本方法中设置为折线长度的1~4%),递归简化距离阈值内的点(图2)。经简化后的轮廓角点集合,计算其凸包本文档来自技高网...

【技术保护点】
1.一种从数码照片中快速自动提取矩形扫描件的方法,包括以下步骤:1)数据降采样及灰度变换;2)图像滤噪及边缘检测;3)等值线跟踪检测最大轮廓线;4)轮廓简化及凸包角点检测;5)区域剪裁及透视变形纠正。

【技术特征摘要】
1.一种从数码照片中快速自动提取矩形扫描件的方法,包括以下步骤:1)数据降采样及灰度变换;2)图像滤噪及边缘检测;3)等值线跟踪检测最大轮廓线;4)轮廓简化及凸包角点检测;5)区域剪裁及透视变形纠正。2.根据权利要求1所述的从数码照片中快速自动提取矩形扫描件的方法,其特征是:所述数据降采样采用等比例缩小的方式。3.根据权利要求1所述的从数码照片中快速自动提取矩形扫描件的方法,其特征是:所述等值线跟踪基于像素的八邻域,从最外边缘起始点开始,按逆时针方向依次将其邻域内的邻接点加入到所跟踪的边缘点集中,迭代进行到没有新的边缘...

【专利技术属性】
技术研发人员:黄晓平曹如军周全书
申请(专利权)人:浙江理工大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1