文档图像矫正方法和装置、矫正模型的训练方法和装置制造方法及图纸

技术编号:37674032 阅读:50 留言:0更新日期:2023-05-26 04:37
本申请提供了一种文档图像矫正方法和装置、文档图像矫正模型的训练方法和装置、计算机设备,以及存储介质,解决了现有技术中待检测文档图像质量较差导致OCR准确率较低的问题。其中,文档图像矫正方法包括:定文档图像的降噪图像、偏转角度和文档图像中文档的角点坐标,偏转角度用于指示文档在文档图像中的偏转角度;基于角点坐标、偏转角度和预设标准文档确定矫正矩阵;基于矫正矩阵、降噪图像和偏转角度确定输出图像。角度确定输出图像。角度确定输出图像。

【技术实现步骤摘要】
文档图像矫正方法和装置、矫正模型的训练方法和装置


[0001]本申请涉及图像处理
,具体涉及一种文档图像矫正方法和装置、文档图像矫正模型的训练方法和装置、计算机设备,以及存储介质。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)是指利用电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。通常OCR技术对待检测文档图像的质量要求较高。然而,随着智能终端设备的普及以及智能终端设备摄像质量的提升,使用智能终端设备就可以通过拍照的方式将纸质文档转换成电子版文档。在智能终端拍照场景中,由于拍摄角度和取景范围难以精确控制,往往导致拍摄到的文档图像质量较差,往往存在一定的噪声,图像中的文档会存在透视变形、倾斜等问题,导致OCR的准确率下降。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种文档图像矫正方法和装置、文档图像矫正模型的训练方法和装置、计算机设备,以及存储介质,以解决相关技术待检测文档图像质量较差导致OC本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文档图像矫正方法,其特征在于,包括:确定文档图像的降噪图像、偏转角度和所述文档图像中文档的角点坐标,所述偏转角度用于指示所述文档在所述文档图像中的倾斜角度;基于所述偏转角度、所述角点坐标和预设标准文档确定矫正矩阵;基于所述降噪图像、所述偏转角度和所述矫正矩阵确定输出图像。2.根据权利要求1所述的文档图像矫正方法,其特征在于,所述确定文档图像的降噪图像、偏转角度和所述文档图像中文档的角点坐标包括:对所述文档图像进行特征提取,得到多个特征表示向量;基于所述多个特征表示向量进行角度分类,得到所述偏转角度;基于所述多个特征表示向量确定预测图像;基于所述预测图像确定所述降噪图像和所述角点坐标。3.根据权利要求2所述的文档图像矫正方法,其特征在于,所述预测图像和所述文档图像的维度相同;所述基于所述预测图像确定所述降噪图像和所述角点坐标包括:确定所述预测图像为所述降噪图像;对所述降噪图像中所述文档的角点进行定位,得到所述角点坐标。4.根据权利要求1

3中任一项所述的文档图像矫正方法,其特征在于,所述基于所述偏转角度、所述角点坐标和预设标准文档确定矫正矩阵包括:基于所述偏转角度对所述预设标准文档进行旋转,以使所述预设标准文档的阅读方向和所述文档的阅读方向一致,得到目标文档;基于所述角点坐标和所述目标文档的目标角点坐标确定所述矫正矩阵。5.根据权利要求1

3中任一项所述的文档图像矫正方法,其特征在于,所述基于所述降噪图像、所述偏转角度和所述矫正矩阵确定输出图像包括:基于所述矫正矩阵对所述降噪图像进行矫正,得到中间图像;基于所述偏转角度对所述中间图像进行矫正,得到所述输出图像。6.一种文档图像矫正模型的训练方法,其特征在于,包括:确定文档图像的降噪图像、偏转角度和所述文档图像中文档的角点坐标,所述文档图像标注有噪声标签、偏转角度标签和所述文档的角点...

【专利技术属性】
技术研发人员:张秋晖范峻植周迅溢蒋宁
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1