一种图像中纸张矫正方法、系统及存储介质技术方案

技术编号：35018145 阅读：22 留言：0更新日期：2022-09-24 22:45

本发明专利技术提供一种图像中纸张矫正方法、系统及存储介质，该方法包括：获取纸张图像，将纸张图像输入至训练好的关键点检测模型中，以输出纸张图像的中心区域热力图及边缘关键点回归图；基于所述中心区域热力图确定纸张图像中待矫正纸张的中心点位置坐标，将各边缘关键点回归图中与中心点位置对应的数值作为待矫正纸张的相应边缘关键点的坐标；获取纸张图像中的纸张尺寸，基于获取到的纸张尺寸构建纸张模板，基于确定的各边缘关键点的数量计算纸张模板上的与各边缘关键点对应的各目标关键点的坐标；基于边缘关键点的坐标和目标关键点的坐标对待矫正纸张进行矫正，以生成矫正后的纸张。该方法能够对纸张图像中存在的畸形纸张快速且准确的矫正。速且准确的矫正。速且准确的矫正。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像中纸张矫正方法、系统及存储介质

[0001]本专利技术涉及计算机
，尤其涉及一种图像中纸张矫正方法、系统及存储介质。

技术介绍

[0002]随着计算机视觉技术的发展，文字识别(OCR)技术在当今智能化办公中扮演着重要的角色。在处理票据表单等相关工作中，文字识别技术因其识别速度快、识别精度高、操作简单、能够大幅度的提高工作效率等特点而被广泛应用。对于纸张中文字识别，通常需要识别出文字所在区域的外接矩形；但是纸张的拍摄环境复杂，当前纸张中文字识别存在以下几个关键问题：(1)相机鱼眼畸变，大倾角带来的成像误差；(2)纸张折叠，纸张扭曲引入的畸变；(3)拍摄角度带来的畸变。
[0003]上述的具有成像误差或畸变的纸张其文字识别难度很大，特别的，当纸张存在折叠或者是拍摄过程中相机倾斜过大时，成像中的纸张发生了扭曲，则此时极大的降低了后续的文字识别的准确率。当前基于深度学习的文字识别算法只注重于文字的检测与文字的识别，没有考虑到纸张折叠和相机拍摄过程中引入的畸变带来的影响；当纸张存在折叠或拍摄角度不佳而存在畸变的情况下，现有的文字识别算法虽然可以非常准确的检测到畸变文字区域，但是将检测到的矩形区域送入到识别网络中时，由于识别区域存在扭曲情况会导致文字识别准确率低。因此，如何能够对纸张图像中存在的畸形纸张快速且准确的矫正，进而减小扭曲纸张中的文字识别错误率是亟待解决的技术问题。

技术实现思路

[0004]有鉴于此，本专利技术提供了一种图像中纸张矫正方法、系统及存储介质，以解决现有技术中存在的一...

【技术保护点】

【技术特征摘要】
1.一种图像中纸张矫正方法，其特征在于，所述方法包括：获取纸张图像，将所述纸张图像输入至训练好的关键点检测模型中，以输出所述纸张图像的中心区域热力图及边缘关键点回归图；基于所述中心区域热力图确定所述纸张图像中待矫正纸张的中心点位置坐标，将各所述边缘关键点回归图中与中心点位置对应的数值作为所述待矫正纸张的相应边缘关键点的坐标；获取纸张图像中的纸张尺寸，基于获取到的所述纸张尺寸构建纸张模板，基于确定的各所述边缘关键点的数量计算所述纸张模板上的与各所述边缘关键点对应的各目标关键点的坐标；基于所述边缘关键点的坐标和目标关键点的坐标对所述待矫正纸张进行矫正，以生成矫正后的纸张。2.根据权利要求1所述的图像中纸张矫正方法，其特征在于，基于所述边缘关键点的坐标和目标关键点的坐标对所述待矫正纸张进行矫正，包括：基于所述边缘关键点的坐标和所述目标关键点的坐标生成匹配点对；将所述匹配点对输入至薄板样条插样算法中，得到所述边缘关键点的坐标和所述目标关键点的坐标之间的变换矩阵；基于所述变换矩阵对所述待矫正纸张进行矫正。3.根据权利要求1所述的图像中纸张矫正方法，其特征在于，所述关键点检测模型采用的算法为HourGlass算法或CornerNet算法。4.根据权利要求3所述的图像中纸张矫正方法，其特征在于，在所述关键点检测模型采用的算法为HourGlass算法时，所述HourGlass算法包括中心区域回归分支和边缘关键点回归分支。5.根据权利要求4所述的图像中纸张矫正方法，其特征在于，所述HourGlass算法的损失函数为：Loss＝L
P
+α
×
L
C
；其中，所述L
P
为所述中心区域热力图对应的损失，且所述L

【专利技术属性】
技术研发人员：熊永平，罗卫冬，张铮，伍贵宾，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人