一种文档图像处理方法技术

技术编号:24125446 阅读:32 留言:0更新日期:2020-05-13 04:26
本发明专利技术涉及图像处理技术领域,尤其涉及一种文档图像处理方法,它包括以下步骤:S1、通过图像获取装置获取原稿文件;S2、进行二值化;S3、将反面翻转;S4、提取纸张外轮廓;S5、提取正反面二值图的最小外接矩形;S6、裁剪出正反面二值图感兴趣区域;S7、创建公共掩膜;S8、对公共掩膜的连通区域轮廓坐标点集进行提取;S9、过滤轮廓点集;S10、对每一个装订孔连通区域边缘进行颜色提取;S11、用步骤S10提取到的颜色对对应的连通区域进行填充。采用这种方法能方便准确的修复文稿图像中的装订孔。

【技术实现步骤摘要】
一种文档图像处理方法
本专利技术涉及图像处理
,尤其涉及一种文档图像处理方法。
技术介绍
近年来,扫描仪、传真机、复印机等图像获取装置被广泛应用于获取书籍、票据、办公文件以及合同等原稿文件的图像。但是,如果原稿文件中存在装订孔时,图像获取装置获取到的原稿图像也会存在装订孔,并且由于装订孔不包含任何有意义的信息,而且还影响原稿图像的美观,因此通常需要对图像获取装置获取的原稿图像中的装订孔进行检测以及填充,以修复原稿图像中的装订孔。现有技术通常使用人工处理的方法修复原稿图像中的装订孔,如采用修图软件进行人工修复,这样就需要大量的人力和时间。
技术实现思路
本专利技术所要解决的技术问题是:提供一种文档图像处理方法,采用这种方法能方便准确的修复文稿图像中的装订孔。本专利技术所采用的技术方案是:一种文档图像处理方法,它包括以下步骤:S1、通过图像获取装置获取原稿文件的正反两面图像;S2、将获取的正反面图像进行二值化,得到正反面二值图;S3、将获得的反面二值图翻转,得到修改后的正反面二值图;S4、获取正反面二值图像所有连通区域的轮廓坐标集,并在坐标轮廓中提取纸张外轮廓;S5、根据步骤S4获得的纸张外轮廓,提取正反面二值图的最小外接矩形;S6、根据步骤S5获得的最小外接矩形,裁剪出正反面二值图感兴趣区域;S7、将步骤S6得到的正反面二值图中感兴趣区域进行或运算,创建公共掩膜;S8、对公共掩膜的连通区域轮廓坐标点集进行提取;S9、过滤轮廓点集,保留装订孔连通区域轮廓;S10、对每一个装订孔连通区域边缘进行颜色提取;S11、用步骤S10提取到的颜色对对应的连通区域进行填充。作为优选,步骤S1获取正反两面图像若为彩色图像,则先进行灰度处理,得到正反面灰度图。作为优选,步骤S5中最小外接矩形包括矩形的中心点坐标、宽、高以及偏转角度信息。作为优选,当步骤S5得到的最小外接矩形中的偏转角度不在设定的阈值范围,则需要根据偏转角度来调整正反面二值图的角度。作为优选,步骤S7创建公共掩膜之后还需要将公共掩膜取反。作为优选,公共掩膜取反后还需要在公共掩膜上绘制矩形轮廓。作为优选,在公共掩膜上绘制矩形轮廓之前需要先将公共掩膜膨胀。作为优选,步骤S9过滤条件有两个:a、连通区域须在预设纸张边缘范围内;b、轮廓的外接矩形长宽须在规定尺寸以内。作为优选,步骤S10颜色提取的方法为计算装订孔连通区域边缘像素色彩的均值。采用以上方法与现有技术相比,本专利技术具有以下优点:通过上述方法首先不需要人工采用修图软件去去除装订孔,效率较高,而且结合图像正反面来将装订孔去除,所以去除装订孔的准确度较高,去除效果较好。将彩色图先变成灰度图再变成二值图,这样转换比较平缓,误差较低。最小外接矩形信息包括了中心坐标以及偏转角度信息,这样当二值图不正时可以根据这些信息进行转换。在公共掩膜上绘制矩形轮廓,这样可以很好的让豁口的装订孔成为封闭。将创建后的公共掩膜取反,这样底色变为黑色,装订孔变为白色,更加方便处理,消除装订孔。设置这两个过滤条件过滤连通区域,这样过滤比较准确,进而使得消除的计算量较少。通过提取订孔连通区域边缘像素色彩的均值来填充装订孔,这样填充后与周围颜色融合的较好,进而使得装订孔消除效果较好。附图说明图1为本专利技术具体实施例一中获取的原稿文件正反面图像。图2为本专利技术具体实施例一中灰度化后的正反面图像。图3为本专利技术具体实施例一中二值化后的正反面图像。图4为本专利技术具体实施例一中二值化的反面图像的镜像。图5为本专利技术具体实施例一中提取纸张外轮廓的正反面图像。图6为本专利技术具体实施例一中得到最小外接矩形的正反面图像。图7为本专利技术具体实施例一中裁剪后得到的正反面感兴趣区域图像。图8为本专利技术具体实施例一中或运算后创建的公共掩膜。图9为本专利技术具体实施例一中掩膜反色后的图像。图10为本专利技术具体实施例一中掩膜膨胀后的图像。图11为本专利技术具体实施例一中掩膜绘制矩形轮廓的图像。图12为本专利技术具体实施例一中掩膜进行连通区域轮廓提取后的图像。图13为本专利技术具体实施例一中轮廓区域过滤后的图像。图14为本专利技术具体实施例一中填充好之后的正反面图像。图15为本专利技术具体实施例二中灰度化后的正反面图像。图16为本专利技术具体实施例二中二值化后的正反面图像。图17为本专利技术具体实施例二中二值化的反面图像的镜像。图18为本专利技术具体实施例二中提取纸张外轮廓的正反面图像。图19为本专利技术具体实施例二中得到最小外接矩形的正反面图像。图20为本专利技术具体实施例二中裁剪后得到的正反面感兴趣区域图像。图21为本专利技术具体实施例二中或运算后创建的公共掩膜。图22为本专利技术具体实施例二中掩膜反色后的图像。图23为本专利技术具体实施例二中掩膜膨胀后的图像。图24为本专利技术具体实施例二中掩膜绘制矩形轮廓的图像。图25为本专利技术具体实施例二中掩膜进行连通区域轮廓提取后的图像。图26为本专利技术具体实施例二中轮廓区域过滤后的图像。具体实施方式以下通过具体实施方式对本专利技术做进一步描述,但是本专利技术不仅限于以下具体实施方式。具体实施例一:一种文档图像处理方法,它包括以下步骤:S1、通过图像获取装置获取原稿文件的正反两面图像,如图1所示;S2、将获得的正反两面图像进行灰度处理,如图2所示;S3、将正反面灰度图转变为正反面二值图,如图3所示;S4、将反面二值图翻转,变成反面二值图的镜像,如图4所示;S5、获取正反面二值图像所有连通区域的轮廓坐标集,并在坐标轮廓中提取纸张外轮廓,如图5所示;S6、根据获取的纸张外轮廓提取正反面二值图的最小外接矩形,如图6所示,并且最小外接矩形包括矩形的中心点坐标、宽、高以及偏转角度信息,而且当偏转角度信息不在设定的阈值范围时,即整个纸张是偏的,此时需要根据最小外接矩形的这些信息将纸张正过来;S7、根据最小外接矩形,裁剪出正反面二值图感兴趣区域;即沿着最小外接矩形将需要的纸张范围裁剪出来,如图7所示;S8、将步骤S6得到的正反面二值图中感兴趣区域进行或运算,创建公共掩膜,如图8所示;即将图7进行或运算,将两者结合起来,只有正反面同样位置都有的才会显示出来,如图8;S9、将公共掩膜取反;即将图8的颜色进行兑换,黑的变白的,白的变黑的,如图9所示;S10、将公共掩膜进行膨胀,扩大穿孔面积,这样有利于避免提取颜色时收到穿孔边缘交接处杂色干扰,如图10所示;S11、在图10图像中的公共掩膜上绘制矩形轮廓,即主要是为了让豁口的装订孔成为封闭,如图11所示;S12、对公共掩膜的连通区域轮廓本文档来自技高网...

【技术保护点】
1.一种文档图像处理方法,其特征在于,它包括以下步骤:/nS1、通过图像获取装置获取原稿文件的正反两面图像;/nS2、将获取的正反面图像进行二值化,得到正反面二值图;/nS3、将获得的反面二值图翻转,得到修改后的正反面二值图;/nS4、获取正反面二值图像所有连通区域的轮廓坐标集,并在坐标轮廓中提取纸张外轮廓;/nS5、根据步骤S4获得的纸张外轮廓,提取正反面二值图的最小外接矩形;/nS6、根据步骤S5获得的最小外接矩形,裁剪出正反面二值图感兴趣区域;/nS7、将步骤S6得到的正反面二值图中感兴趣区域进行或运算,创建公共掩膜;/nS8、对公共掩膜的连通区域轮廓坐标点集进行提取;/nS9、过滤轮廓点集,保留装订孔连通区域轮廓;/nS10、对每一个装订孔连通区域边缘进行颜色提取;/nS11、用步骤S10提取到的颜色对对应的连通区域进行填充。/n

【技术特征摘要】
1.一种文档图像处理方法,其特征在于,它包括以下步骤:
S1、通过图像获取装置获取原稿文件的正反两面图像;
S2、将获取的正反面图像进行二值化,得到正反面二值图;
S3、将获得的反面二值图翻转,得到修改后的正反面二值图;
S4、获取正反面二值图像所有连通区域的轮廓坐标集,并在坐标轮廓中提取纸张外轮廓;
S5、根据步骤S4获得的纸张外轮廓,提取正反面二值图的最小外接矩形;
S6、根据步骤S5获得的最小外接矩形,裁剪出正反面二值图感兴趣区域;
S7、将步骤S6得到的正反面二值图中感兴趣区域进行或运算,创建公共掩膜;
S8、对公共掩膜的连通区域轮廓坐标点集进行提取;
S9、过滤轮廓点集,保留装订孔连通区域轮廓;
S10、对每一个装订孔连通区域边缘进行颜色提取;
S11、用步骤S10提取到的颜色对对应的连通区域进行填充。


2.根据权利要求1所述的一种文档图像处理方法,其特征在于:步骤S1获取正反两面图像若为彩色图像,则先进行灰度处理,得到正反面灰度图。


3.根据权利要求1所述的一种文...

【专利技术属性】
技术研发人员:刘丁维彭明
申请(专利权)人:宁波华高信息科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1