文档矫正方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：30633104 阅读：20 留言：0更新日期：2021-11-04 00:08

本申请涉及一种文档矫正方法、装置、计算机设备和存储介质，方法包括：获取待矫正图像；对待矫正图像进行逐层下采样，得到不同尺度的下采样图像特征；基于训练确定的深度学习神经网络提取待矫正图像的图像特征，并根据待矫正图像的图像特征确定待矫正图像的像素偏移矩阵；深度学习神经网络包括级联的第一unet网络和第二unet网络；将第一unet网络的输出结果进行归一化处理后，将归一化处理得到的特征与第一unet网络的输出结果拼接，将得到的拼接特征作为第二unet网络的输入；基于像素偏移矩阵对待矫正图像进行映射，得到待矫正图像的矫正后图像。上述方法无需依赖环境参数，仅需一次处理可获得像素偏移矩阵，处理过程简单，计算量小。小。小。

全部详细技术资料下载

【技术实现步骤摘要】
文档矫正方法、装置、计算机设备和存储介质

[0001]本申请涉及计算机
，特别是涉及一种文档矫正方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着技术的发展，出现了将纸质文档转换为电子文档的技术，通过将纸质文档转换为电子文档，可以由线下处理转为线上处理，提高处理效率，便于远距离传递和存档等等。将纸质文档转为电子文档通常采取扫描、拍照等方式，然而在扫描、拍照过程中，可能出现图像扭曲、倾斜等情况，针对出现的这种情况，需将出现扭曲、倾斜的文档图像进行矫正。
[0003]相关技术中利用矫正前源图像及摄像环境参数作为先验知识，计算垂直变形系数和水平变形系数，最终矫正源图像。该方法依赖环境参数的设定学习，处理过程复杂，计算量大。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种不依赖环境参数设定的文档矫正方法、装置、计算机设备和存储介质。
[0005]一种文档矫正方法，所述方法包括：
[0006]获取待矫正图像；
[0007]基于训练确定的深度学习神经网...

【技术保护点】

【技术特征摘要】
1.一种文档矫正方法，其特征在于，所述方法包括：获取待矫正图像；基于训练确定的深度学习神经网络提取所述待矫正图像的图像特征，并根据所述待矫正图像的图像特征确定所述待矫正图像的像素偏移矩阵；所述深度学习神经网络包括级联的第一unet网络和第二unet网络；将所述第一unet网络的输出结果进行归一化处理后，将归一化处理得到的特征与所述第一unet网络的输出结果拼接，将得到的拼接特征作为所述第二unet网络的输入；基于所述像素偏移矩阵对所述待矫正图像进行映射，得到所述待矫正图像的矫正后图像。2.根据权利要求1所述的文档矫正方法，其特征在于，在基于所述像素偏移矩阵对所述待矫正图像进行映射，得到所述待矫正图像的矫正后图像之前，还包括：对所述像素偏移矩阵进行平滑处理，得到平滑后偏移矩阵；所述基于所述像素偏移矩阵对所述待矫正图像进行映射，得到所述待矫正图像的矫正后图像，包括：基于所述平滑后偏移矩阵对所述待矫正图像进行映射，得到所述矫正后图像。3.根据权利要求2所述的文档矫正方法，其特征在于，所述对所述像素偏移矩阵进行平滑处理，得到平滑后偏移矩阵包括：以第一预设大小的窗口对所述像素偏移矩阵进行高斯平滑处理，得到高斯平滑偏移矩阵；以第二预设大小的窗口对所述高斯平滑偏移矩阵进行平均平滑，得到所述平滑后偏移矩阵。4.根据权利要求1所述的文档矫正方法，其特征在于，所述深度学习神经网络的训练过程包括：将扭曲样本图像输入预设深度学习神经网络框架；获取所述预设深度学习神经网络框架输出的所述扭曲样本图像的预测像素偏移矩阵；基于所述预测像素偏移矩阵、预设损失函数确定损失函数值；根据所述损失函数值对所述预设深度学习神经网络框架进行训练，直至获得所述深度学习神经网络。5.根据权利要求4所述的文档矫正方法，其特征在于，所述预设损失函数包括：单像素预测损失、相邻像素偏移差损失和完全变化...

【专利技术属性】
技术研发人员：胡益清，李鑫，董帅帅，郑岩，姜德强，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人