基于深度学习的图像校正方法及系统技术方案

技术编号:32506119 阅读:42 留言:0更新日期:2022-03-02 10:19
一种基于深度学习的图像校正方法及系统。图像校正方法包括以下步骤。通过深度学习模型接收具有至少一字的图像,并根据图像产生透视变换矩阵。根据透视变换矩阵对图像执行透视变换,以获得包含此至少一字的正面视角的校正图像。根据图像产生包含此至少一字的正面视角的最佳校正图像。获得对应图像与最佳校正图像的最佳透视变换矩阵。计算最佳透视变换矩阵与透视变换矩阵之间的损失值。使用损失值更新深度学习模型。学习模型。学习模型。

【技术实现步骤摘要】
基于深度学习的图像校正方法及系统


[0001]本专利技术涉及一种图像校正方法及系统,且特别涉及一种基于深度学习的图像校正方法及系统。

技术介绍

[0002]在图像辨识领域中,特别是图像中的字辨识,通常需要在图像中先找出具有字的区域图像,并将此区域图像校正成正面视角的图像,以便后续的辨识模型进行字辨识。图像校正程序可将各种不同视角、距离的图像,转成同一角度与距离的正面视角的图像,此程序可加快辨识模型的学习以及提高辨识正确率。
[0003]然而,在目前的技术中,图像校正程序仍需依靠传统图像处理方法,以人工找出旋转参数,并反复调整参数才可提升图像校正程序的正确率。此外,图像校正程序也可由人工智能(AI)执行,但是仅能找出顺时针/逆时针旋转角度,无法适用于复杂的图像缩放、位移、倾斜等。
[0004]因此,如何有效率地并正确地将各种图像校正成正面视角的图像,已成为产业界致力研究的一项目标。

技术实现思路

[0005]本专利技术涉及一种基于深度学习的图像校正方法及系统,其利用深度学习模型找出图像校正程序中的透视变换参数以有效本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的图像校正方法,包括:通过深度学习模型接收具有至少一字的图像,并根据该图像产生透视变换矩阵;根据该透视变换矩阵对该图像执行透视变换,以获得包含该至少一字的正面视角的校正图像;根据该图像产生包含该至少一字的正面视角的最佳校正图像;获得对应该图像与该最佳校正图像的最佳透视变换矩阵;计算该最佳透视变换矩阵与该透视变换矩阵之间的损失值;以及使用该损失值更新该深度学习模型。2.如权利要求1所述的图像校正方法,其中在根据该图像产生包含该至少一字的正面视角的该最佳校正图像的步骤中包括:标记该图像,该标记具有涵盖该至少一字的标记范围。3.如权利要求1所述的图像校正方法,其中还包括:当标记范围无法涵盖该至少一字时,延伸该图像以获得延伸图像;以及标记该延伸图像,使该标记范围涵盖该至少一字。4.如权利要求1所述的图像校正方法,其中还包括:通过图像提取单元提取该图像;以及根据该图像提取单元的拍摄信息限缩该透视变换矩阵的多个透视变换参数。5.如权利要求4所述的图像校正方法,其中该拍摄信息包括拍摄位置、拍摄方向及拍摄角度。6.一种基于深度学习的...

【专利技术属性】
技术研发人员:李冠德黄名嘉林宏轩李宇哲罗佳玲
申请(专利权)人:财团法人工业技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1