【技术实现步骤摘要】
一种电子卷宗的空白页和模糊页的检测方法及装置
本专利技术涉及图像处理
,特别涉及一种电子卷宗的空白页和模糊页的检测方法及装置。
技术介绍
在我国最高人民法院的《中国法院信息化发展报告》中全面推动智慧法院建设意见的推动下,电子卷宗应用的发展得到快速推进。由于大部分的纸质卷宗是通过扫描仪和高拍仪进行数字化,因此不可避免的会因为设备的性能以及操作流程不规范产生空白卷宗图像和模糊卷宗图像。卷宗数字化的过程如图1所示。一份卷宗由多份不同的文件组成,且很多文件是双面打印的。在批量扫描入卷的时候,奇数页的文档往往会扫描出一张空白页,虽然目前很多打印机都可以过滤空白页,但是由于卷宗文档的图像具有一定的复杂性与多样性,还是会扫描出很多空白图像。还有很多卷宗材料是通过高拍仪进行数字化的,往往会因为仪器的焦距调整不及时而产生模糊的卷宗图像。如果不能对上述现象加以人工干预,空白、模糊图像也会在扫描过程中入卷。图2为模糊图像的样例。随着计算机视觉技术的发展,已经有很多算法应用于图像的空白和模糊检测,比如使用形态学变换方法进行空白 ...
【技术保护点】
1.一种电子卷宗的空白页和模糊页的检测方法,其特征在于:包括检测前的训练步骤和检测步骤,所述的检测前的训练步骤包括:/n步骤S101、对各种类型的图像分别裁剪,并对裁剪后的图像进行空白区域和正常区域的标注;/n步骤S102、对标注好的图像进行滤波和提取图像边缘特征的预处理;/n步骤S103、将预处理好的图像形成训练集;/n步骤S104、针对训练集进行学习,形成空白区域检测模型;/n所述的检测步骤,是基于空白区域检测模型对待检测的图像进行检测,并输出检测结果。/n
【技术特征摘要】
1.一种电子卷宗的空白页和模糊页的检测方法,其特征在于:包括检测前的训练步骤和检测步骤,所述的检测前的训练步骤包括:
步骤S101、对各种类型的图像分别裁剪,并对裁剪后的图像进行空白区域和正常区域的标注;
步骤S102、对标注好的图像进行滤波和提取图像边缘特征的预处理;
步骤S103、将预处理好的图像形成训练集;
步骤S104、针对训练集进行学习,形成空白区域检测模型;
所述的检测步骤,是基于空白区域检测模型对待检测的图像进行检测,并输出检测结果。
2.根据权利要求1所述的一种电子卷宗的空白页和模糊页的检测方法,其特征在于:所述的训练集包括空白区域集和正常区域集。
3.根据权利要求1所述的一种电子卷宗的空白页和模糊页的检测方法,其特征在于:所述的检测步骤包括空白页检测步骤和模糊页检测步骤。
4.根据权利要求3所述的一种电子卷宗的空白页和模糊页的检测方法,其特征在于:所述的空白页检测步骤包括:
步骤S201、将待检测图像进行裁剪;
步骤S202、依次对裁剪后的每个窗口都进行图像滤波和边缘特征提取的预处理操作;
步骤S203、对预处理操作的每个窗口基于空白区域检测模型进行匹配,如果有一个窗口的匹配结果为非空白,就停止匹配,输出非空白;否则匹配所有窗口后输出空白。
5.根据权利要求3所述的一种电子卷宗的空白页和模糊页的检测方法,其特征在于:所述的模糊页检测步骤包括:
步骤S301、将待检图像裁剪成至少一个窗口;
步骤S302、对每个窗口进行滤波和边缘特征提取的预处理;
步骤S303、依次对每个预处理的窗口基于空白页检测模型进行匹配,匹配是否为空白;如果是,则到步骤S304;如果不是,则到步骤S305;
步骤S304、将所述窗口标记为清晰,输出清晰的结论,到步骤S307;
步骤S305、对所述窗口进行至少三种模糊检测,每种模糊检测都输出清晰、模糊或严重模糊的结论;
步骤S306、对至少三个模糊检测输出的结论进行投票表决,输出投票表决后的结论;
步骤S307、检测是否所有的窗口都完成匹配,如果是则...
【专利技术属性】
技术研发人员:贺敏,赵岳,宁柯琳,张春玮,刘明,王建超,
申请(专利权)人:北京华宇信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。