无约束褶皱文档图像矫正方法、系统、设备及存储介质技术方案

技术编号:38163280 阅读:32 留言:0更新日期:2023-07-13 09:37
本发明专利技术公开了一种无约束褶皱文档图像矫正方法、系统、设备及存储介质,它们是一一对应的方案,相关方案能够解决现有方案应用场景受限的问题,即不能矫正无文档边界或仅包含部分文档边界的形变文档图像。同时,本发明专利技术也提升了对于有完整文档边界的图像的矫正恢复效果。相较于传统方法,本发明专利技术对输入的褶皱文档图像无任何形式上的约束,能够更加鲁棒和准确地矫正日常生活中拍摄的各类形变文档图像,本发明专利技术可被广泛应用于智能手机等带有相机的便携式设备,应用场景更加广泛,准确率更高。因此,本发明专利技术将极大地促进文档图像数字化的普及,为纸质文档的数字化转换提供强有力的技术支持。质文档的数字化转换提供强有力的技术支持。质文档的数字化转换提供强有力的技术支持。

【技术实现步骤摘要】
无约束褶皱文档图像矫正方法、系统、设备及存储介质


[0001]本专利技术涉及褶皱文档图像矫正
,尤其涉及一种无约束褶皱文档图像矫正方法、系统、设备及存储介质。

技术介绍

[0002]随着便携式相机和智能手机的快速进步和普及,越来越多的人选择用它们拍摄扫描纸质文档,而不需要像以往一样使用专用平板扫描仪。然而,由于拍摄环境中诸多不确定因素,如相机位置不确定、光照环境不确定,以及纸张形变类型和程度不确定等,由这些设备拍摄的文档图像往往会带有不同程度的各式各样的失真和变形。这使得下游任务的处理,如自动化的文本识别、内容分析、编辑和理解等,变得更加困难。同时,这也不利于日常生活中信息和知识的传播和交流。为了解决这一问题,褶皱文档图像矫正成为了当前计算机视觉领域中的重要研究课题。
[0003]传统的解决方案主要基于3D重建技术。这些方法通常需要依赖附加的硬件设备(如激光扫描仪、深度相机等),或者是通过围绕褶皱纸张拍摄多视角图像,来重建纸张的三维立体结构,并在此基础上进行展平矫正。然而,由于较高的硬件成本或繁琐的拍摄要求,这些技术的推广和使用受本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种无约束褶皱文档图像矫正方法,其特征在于,包括:建模褶皱文档图像到无形变文档图像的像素映射关系,生成样本对,其中,每一样本对包含无约束褶皱文档图像块以及无约束褶皱文档图像块至无形变文档图像块的坐标映射矩阵;构建无约束的文档图像矫正网络,并利用多个样本对形成的训练数据集进行训练;将无约束褶皱文档图像输入至训练后的无约束的文档图像矫正网络,获得预测坐标映射矩阵,利用所述预测坐标映射矩阵对所述无约束褶皱文档图像矫正,获得矫正图像。2.根据权利要求1所述的一种无约束褶皱文档图像矫正方法,其特征在于,所述建模褶皱文档图像到无形变文档图像的像素映射关系,生成样本对包括:获取具有完整边界的褶皱文档图像,然后使用其对应的坐标映射矩阵,将所述具有完整边界的褶皱文档图像矫正为无形变文档图像;在所述具有完整边界的褶皱文档图像中随机截取一个区域的图像块,称为无约束褶皱文档图像块,根据该区域的坐标映射矩阵找到无形变文档图像中对应区域,称为无形变文档图像块,再截取坐标映射矩阵中同区域的矩阵,即无约束褶皱文档图像块至无形变文档图像块的坐标映射矩阵;获得的无约束褶皱文档图像块以及无约束褶皱文档图像块至无形变文档图像块的坐标映射矩阵形成一个样本对。3.根据权利要求1所述的一种无约束褶皱文档图像矫正方法,其特征在于,所述构建无约束的文档图像矫正网络,并利用多个样本对形成的训练数据集进行训练包括:构建包含特征提取器与特征解码器的无约束的文档图像矫正网络;训练时,输入为样本对中的无约束褶皱文档图像块,通过特征提取器进行特征提取,并通过特征解码器输出预测坐标映射矩阵,将样本对中的无约束褶皱文档图像块至无形变文档图像块的坐标映射矩阵作为监督信息,与预测坐标映射矩阵构建损失函数训练所述无约束的文档图像矫正网络。4.根据权利要求1所述的一种无约束褶皱文档图像矫正方法,其特征在于,所述利用所述预测坐标映射矩阵对所述无约束褶皱文档图像矫正,获得矫正图像包括:利用上采样算法,通过预测坐标映射矩阵对所述无约束褶皱文档图像进行矫正,得到矫正图像。5.一种无约束褶皱文档图像矫正系统,其特征在于,包括:像素映射关系建模与样本对生成单元,用于建模褶皱文档图像到无形变文档图像的像素映射关系,生成样本对,其中,每一样本对包含无约束褶皱文档图像块以及无约束褶皱文档图像...

【专利技术属性】
技术研发人员:李厚强周文罡冯浩刘绍锴
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1