一种基于深度学习的扭曲图像矫正方法、装置和存储介质制造方法及图纸

技术编号：27937350 阅读：32 留言：0更新日期：2021-04-02 14:17

本发明专利技术提供了一种基于深度学习的扭曲图像矫正方法、装置和存储介质，涉及图像处理技术领域，包括：提取扭曲图像的特征数据；以训练图像和训练图像对应的偏移图作为训练数据，构建用于矫正的深度神经网络模型；根据特征数据，识别出扭曲图像中的待矫正元素；利用用于矫正的深度神经网络模型预测待矫正元素的偏移图，生成预测偏移图；根据预测偏移图矫正扭曲图像。该方法基于图像特征识别缩小了处理范围，从而有效降低扭曲图像中背景、干扰图形和光照等因素对于矫正效果的影响，提高基于深度学习的扭曲矫正方法的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的扭曲图像矫正方法、装置和存储介质
本专利技术涉及图像处理
，具体而言，涉及一种基于深度学习的扭曲图像矫正方法、装置和存储介质。
技术介绍
在传统的文档数字化过程中，通常使用扫描仪对文档进行扫描，得到清晰平整的文档图像进行存储。但是扫描仪体积过大，不易携带，需要对文档进行按压，使用不便。随着移动产品的发展，使用手机等移动设备进行文档扫描已经是一种趋势，虽然手机的出现很大程度上代替了扫描仪，随之而来也出现了一些问题，比如使用手机拍摄文档时由于拍摄设备和文档平面不平行导致的透视形变，以及文档本身没有完全展开，存在弯曲甚至折痕。这会严重影响后续的光学字符识别等任务。目前，针对扭曲文档矫正的方法一般主要可以分为：基于三维重建的方法；基于模型的方法和基于深度学习的方法。对于三维重建的方法，通常使用专门的硬件设备来完成矫正，比如结构光源、立体照相机或者激光相机。通过这些设备获得文档的三维信息。通过三维重建得到变形文档和平整文档之间的映射关系，最后完成矫正，此方法可以有效处理变形，得到比较优秀的效果，但是此类方法对于硬件的要求过高，限制了方法的应用，通过手机无法完成矫正。对于基于模型的方法，通过将弯曲文档的表面建模为广义圆柱体来完成矫正，此类方法通常矫正效果不错但是适应的场景不多，大多数扭曲和理想的模型差距较大。对于基于深度学习的方法，通常使用语义分割的模型对扭曲原图进行偏移图的预测，此类方法适用于弯曲和折叠等多种复杂场景，但是矫正效果不够理想。
技术实现思路
本专利技术旨在至少解决现有技...

【技术保护点】
1.一种基于深度学习的扭曲图像矫正方法，其特征在于，包括：/n提取扭曲图像的特征数据；/n以训练图像和训练图像对应的偏移图作为训练数据，构建用于矫正的深度神经网络模型；/n根据所述特征数据，识别出所述扭曲图像中的待矫正元素；/n利用所述用于矫正的深度神经网络模型预测所述待矫正元素的偏移图，生成预测偏移图；/n根据所述预测偏移图矫正所述扭曲图像。/n

【技术特征摘要】
1.一种基于深度学习的扭曲图像矫正方法，其特征在于，包括：
提取扭曲图像的特征数据；
以训练图像和训练图像对应的偏移图作为训练数据，构建用于矫正的深度神经网络模型；
根据所述特征数据，识别出所述扭曲图像中的待矫正元素；
利用所述用于矫正的深度神经网络模型预测所述待矫正元素的偏移图，生成预测偏移图；
根据所述预测偏移图矫正所述扭曲图像。

2.根据权利要求1所述的基于深度学习的扭曲图像矫正方法，其特征在于，所述提取扭曲图像的特征数据的步骤，具体包括：
利用深度神经网络模型对所述扭曲图像进行文本行检测，提取文本行中心线，生成所述扭曲图像的文本特征图。

3.根据权利要求2所述的基于深度学习的扭曲图像矫正方法，其特征在于，所述利用深度神经网络模型对所述扭曲图像进行文本行检测，提取文本行中心线，生成所述扭曲图像的文本特征图的步骤，具体包括：
使用预训练的语义分割模型提取所述扭曲图像的文本区域特征图和文本行中心线特征图；
使用所述文本区域特征图和所述文本行中心线特征图进行后处理，生成精准化的文本行中心线特征图。

4.根据权利要求1所述的基于深度学习的扭曲图像矫正方法，其特征在于，所述以训练图像和训练图像对应的偏移图作为训练数据，构建用于矫正的深度神经网络模型的步骤，具体包括：
获取非扭曲图像，对所述非扭曲图像做扭曲处理，生成自建扭曲图像作为所述训练图像，生成对应于扭曲处理过程的偏移图作为所述训练图像对应的偏移图，以构建所述用于矫正的深度神经网络模型。

5.根据权利要求4所述的基于深度学习的扭曲图像矫正方法，其特征在于，所述扭曲处理具体包括：
根据所述非扭曲图像的...

【专利技术属性】
技术研发人员：朱远平，吴磊，张立新，
申请(专利权)人：天津师范大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人