【技术实现步骤摘要】
一种基于深度学习的扭曲图像矫正方法、装置和存储介质
本专利技术涉及图像处理
,具体而言,涉及一种基于深度学习的扭曲图像矫正方法、装置和存储介质。
技术介绍
在传统的文档数字化过程中,通常使用扫描仪对文档进行扫描,得到清晰平整的文档图像进行存储。但是扫描仪体积过大,不易携带,需要对文档进行按压,使用不便。随着移动产品的发展,使用手机等移动设备进行文档扫描已经是一种趋势,虽然手机的出现很大程度上代替了扫描仪,随之而来也出现了一些问题,比如使用手机拍摄文档时由于拍摄设备和文档平面不平行导致的透视形变,以及文档本身没有完全展开,存在弯曲甚至折痕。这会严重影响后续的光学字符识别等任务。目前,针对扭曲文档矫正的方法一般主要可以分为:基于三维重建的方法;基于模型的方法和基于深度学习的方法。对于三维重建的方法,通常使用专门的硬件设备来完成矫正,比如结构光源、立体照相机或者激光相机。通过这些设备获得文档的三维信息。通过三维重建得到变形文档和平整文档之间的映射关系,最后完成矫正,此方法可以有效处理变形,得到比较优秀的效果,但是此类方法对于 ...
【技术保护点】
1.一种基于深度学习的扭曲图像矫正方法,其特征在于,包括:/n提取扭曲图像的特征数据;/n以训练图像和训练图像对应的偏移图作为训练数据,构建用于矫正的深度神经网络模型;/n根据所述特征数据,识别出所述扭曲图像中的待矫正元素;/n利用所述用于矫正的深度神经网络模型预测所述待矫正元素的偏移图,生成预测偏移图;/n根据所述预测偏移图矫正所述扭曲图像。/n
【技术特征摘要】
1.一种基于深度学习的扭曲图像矫正方法,其特征在于,包括:
提取扭曲图像的特征数据;
以训练图像和训练图像对应的偏移图作为训练数据,构建用于矫正的深度神经网络模型;
根据所述特征数据,识别出所述扭曲图像中的待矫正元素;
利用所述用于矫正的深度神经网络模型预测所述待矫正元素的偏移图,生成预测偏移图;
根据所述预测偏移图矫正所述扭曲图像。
2.根据权利要求1所述的基于深度学习的扭曲图像矫正方法,其特征在于,所述提取扭曲图像的特征数据的步骤,具体包括:
利用深度神经网络模型对所述扭曲图像进行文本行检测,提取文本行中心线,生成所述扭曲图像的文本特征图。
3.根据权利要求2所述的基于深度学习的扭曲图像矫正方法,其特征在于,所述利用深度神经网络模型对所述扭曲图像进行文本行检测,提取文本行中心线,生成所述扭曲图像的文本特征图的步骤,具体包括:
使用预训练的语义分割模型提取所述扭曲图像的文本区域特征图和文本行中心线特征图;
使用所述文本区域特征图和所述文本行中心线特征图进行后处理,生成精准化的文本行中心线特征图。
4.根据权利要求1所述的基于深度学习的扭曲图像矫正方法,其特征在于,所述以训练图像和训练图像对应的偏移图作为训练数据,构建用于矫正的深度神经网络模型的步骤,具体包括:
获取非扭曲图像,对所述非扭曲图像做扭曲处理,生成自建扭曲图像作为所述训练图像,生成对应于扭曲处理过程的偏移图作为所述训练图像对应的偏移图,以构建所述用于矫正的深度神经网络模型。
5.根据权利要求4所述的基于深度学习的扭曲图像矫正方法,其特征在于,所述扭曲处理具体包括:
根据所述非扭曲图像的...
【专利技术属性】
技术研发人员:朱远平,吴磊,张立新,
申请(专利权)人:天津师范大学,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。