【技术实现步骤摘要】
无约束褶皱文档图像矫正方法、系统、设备及存储介质
[0001]本专利技术涉及褶皱文档图像矫正
,尤其涉及一种无约束褶皱文档图像矫正方法、系统、设备及存储介质。
技术介绍
[0002]随着便携式相机和智能手机的快速进步和普及,越来越多的人选择用它们拍摄扫描纸质文档,而不需要像以往一样使用专用平板扫描仪。然而,由于拍摄环境中诸多不确定因素,如相机位置不确定、光照环境不确定,以及纸张形变类型和程度不确定等,由这些设备拍摄的文档图像往往会带有不同程度的各式各样的失真和变形。这使得下游任务的处理,如自动化的文本识别、内容分析、编辑和理解等,变得更加困难。同时,这也不利于日常生活中信息和知识的传播和交流。为了解决这一问题,褶皱文档图像矫正成为了当前计算机视觉领域中的重要研究课题。
[0003]传统的解决方案主要基于3D重建技术。这些方法通常需要依赖附加的硬件设备(如激光扫描仪、深度相机等),或者是通过围绕褶皱纸张拍摄多视角图像,来重建纸张的三维立体结构,并在此基础上进行展平矫正。然而,由于较高的硬件成本或繁琐的拍摄要求,这 ...
【技术保护点】
【技术特征摘要】
1.一种无约束褶皱文档图像矫正方法,其特征在于,包括:建模褶皱文档图像到无形变文档图像的像素映射关系,生成样本对,其中,每一样本对包含无约束褶皱文档图像块以及无约束褶皱文档图像块至无形变文档图像块的坐标映射矩阵;构建无约束的文档图像矫正网络,并利用多个样本对形成的训练数据集进行训练;将无约束褶皱文档图像输入至训练后的无约束的文档图像矫正网络,获得预测坐标映射矩阵,利用所述预测坐标映射矩阵对所述无约束褶皱文档图像矫正,获得矫正图像。2.根据权利要求1所述的一种无约束褶皱文档图像矫正方法,其特征在于,所述建模褶皱文档图像到无形变文档图像的像素映射关系,生成样本对包括:获取具有完整边界的褶皱文档图像,然后使用其对应的坐标映射矩阵,将所述具有完整边界的褶皱文档图像矫正为无形变文档图像;在所述具有完整边界的褶皱文档图像中随机截取一个区域的图像块,称为无约束褶皱文档图像块,根据该区域的坐标映射矩阵找到无形变文档图像中对应区域,称为无形变文档图像块,再截取坐标映射矩阵中同区域的矩阵,即无约束褶皱文档图像块至无形变文档图像块的坐标映射矩阵;获得的无约束褶皱文档图像块以及无约束褶皱文档图像块至无形变文档图像块的坐标映射矩阵形成一个样本对。3.根据权利要求1所述的一种无约束褶皱文档图像矫正方法,其特征在于,所述构建无约束的文档图像矫正网络,并利用多个样本对形成的训练数据集进行训练包括:构建包含特征提取器与特征解码器的无约束的文档图像矫正网络;训练时,输入为样本对中的无约束褶皱文档图像块,通过特征提取器进行特征提取,并通过特征解码器输出预测坐标映射矩阵,将样本对中的无约束褶皱文档图像块至无形变文档图像块的坐标映射矩阵作为监督信息,与预测坐标映射矩阵构建损失函数训练所述无约束的文档图像矫正网络。4.根据权利要求1所述的一种无约束褶皱文档图像矫正方法,其特征在于,所述利用所述预测坐标映射矩阵对所述无约束褶皱文档图像矫正,获得矫正图像包括:利用上采样算法,通过预测坐标映射矩阵对所述无约束褶皱文档图像进行矫正,得到矫正图像。5.一种无约束褶皱文档图像矫正系统,其特征在于,包括:像素映射关系建模与样本对生成单元,用于建模褶皱文档图像到无形变文档图像的像素映射关系,生成样本对,其中,每一样本对包含无约束褶皱文档图像块以及无约束褶皱文档图像...
【专利技术属性】
技术研发人员:李厚强,周文罡,冯浩,刘绍锴,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。