文档图像矫正方法和装置、矫正模型的训练方法和装置制造方法及图纸

技术编号:37674032 阅读:26 留言:0更新日期:2023-05-26 04:37
本申请提供了一种文档图像矫正方法和装置、文档图像矫正模型的训练方法和装置、计算机设备,以及存储介质,解决了现有技术中待检测文档图像质量较差导致OCR准确率较低的问题。其中,文档图像矫正方法包括:定文档图像的降噪图像、偏转角度和文档图像中文档的角点坐标,偏转角度用于指示文档在文档图像中的偏转角度;基于角点坐标、偏转角度和预设标准文档确定矫正矩阵;基于矫正矩阵、降噪图像和偏转角度确定输出图像。角度确定输出图像。角度确定输出图像。

【技术实现步骤摘要】
文档图像矫正方法和装置、矫正模型的训练方法和装置


[0001]本申请涉及图像处理
,具体涉及一种文档图像矫正方法和装置、文档图像矫正模型的训练方法和装置、计算机设备,以及存储介质。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)是指利用电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。通常OCR技术对待检测文档图像的质量要求较高。然而,随着智能终端设备的普及以及智能终端设备摄像质量的提升,使用智能终端设备就可以通过拍照的方式将纸质文档转换成电子版文档。在智能终端拍照场景中,由于拍摄角度和取景范围难以精确控制,往往导致拍摄到的文档图像质量较差,往往存在一定的噪声,图像中的文档会存在透视变形、倾斜等问题,导致OCR的准确率下降。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种文档图像矫正方法和装置、文档图像矫正模型的训练方法和装置、计算机设备,以及存储介质,以解决相关技术待检测文档图像质量较差导致OCR准确率较低的问题。
[0004]本申请第一方面提供了一种文档图像矫正方法,包括:确定文档图像的降噪图像、偏转角度和文档图像中文档的角点坐标,偏转角度用于指示文档在文档图像中的偏转角度;基于偏转角度、角点坐标和预设标准文档确定矫正矩阵;基于降噪图像、偏转角度和矫正矩阵确定输出图像。
[0005]可以看出,在本申请实施例中,确定文档图像的降噪图像、偏转角度和文档图像中文档的角点坐标,基于角点坐标、偏转角度和预设标准文档确定矫正矩阵;基于矫正矩阵、降噪图像和偏转角度确定输出图像。其中,降噪图像用于去掉文档图像中的噪声,偏转角度用于矫正文档的倾斜,矫正矩阵用于矫正文档的畸变。因此,通过综合降噪图像、偏转角度和矫正矩阵来确定输出图像,能够同时解决文档图像中存在的噪声、倾斜和透视变形问题,改善文档图像的质量,进而可以提高后续OCR处理的准确率。与此同时,采用本实施例提供的文档图像矫正方法对文档图像进行预处理后再进行OCR,可以降低对文档图像的质量要求,从而提高对输入图像的适用范围,普适性更强。
[0006]本申请第二方面提供了一种文档图像矫正模型的训练方法,包括:确定文档图像的降噪图像、偏转角度和文档图像中文档的角点坐标,文档图像标注有噪声标签、偏转角度标签和文档的角点坐标标签;基于降噪图像和噪声标签确定第一损失函数;基于角点坐标和角点坐标标签确定第二损失函数;基于偏转角度和偏转角度标签确定第三损失函数;基于第一损失函数、第二损失函数和第三损失函数确定总损失函数;以及,基于总损失函数调整文档图像矫正模型的参数。
[0007]可以看出,在本申请实施例中,首先确定文档图像的降噪图像和偏转角度,以及文
档图像中文档的角点坐标,文档图像标注有噪声标签、偏转角度标签和文档的角点坐标标签,然后基于降噪图像和噪声标签确定第一损失函数,基于偏转角度和偏转角度标签确定第二损失函数,基于角点坐标和角点坐标标签确定第三损失函数,最后基于第一损失函数、第二损失函数和第三损失函数确定总损失函数;以及,基于总损失函数调整文档图像矫正模型的参数。后续利用该文档图像矫正模型对文档图像进行预处理时,可以基于文档图像矫正模型输出的偏转角度和文档的角点坐标确定矫正矩阵,之后综合降噪图像、偏转角度和矫正矩阵共同确定输出图像。由于降噪图像用于去掉文档图像中的噪声,偏转角度用于矫正文档的倾斜,矫正矩阵用于矫正文档的畸变。因此,综合降噪图像、偏转角度和矫正矩阵确定的输出图像,能够同时解决文档图像中存在的噪声、倾斜和透视变形问题,改善文档图像的质量,进而可以提高后续OCR处理的准确率。
[0008]本申请第三方面提供了一种文档图像矫正装置,包括:第一确定模块,确定文档图像的降噪图像、偏转角度和文档图像中文档的角点坐标,偏转角度用于指示文档在文档图像中的偏转角度;第二确定模块,用于基于偏转角度、角点坐标和预设标准文档确定矫正矩阵;第三确定模块,用于基于降噪图像、偏转角度和矫正矩阵确定输出图像。
[0009]本申请第四方面提供了一种文档图像矫正模型的训练装置,包括:第一确定模块,用于确定文档图像的降噪图像、偏转角度和文档图像中文档的角点坐标,文档图像标注有噪声标签、偏转角度标签和文档的角点坐标标签;第二确定模块,用于基于降噪图像和噪声标签确定第一损失函数,基于角点坐标和角点坐标标签确定第二损失函数,基于偏转角度和偏转角度标签确定第三损失函数;第三确定模块,用于基于第一损失函数、第二损失函数和第三损失函数确定总损失函数;以及,调整模块,用于基于总损失函数调整文档图像矫正模型的参数。
[0010]本申请第五方面提供了一种计算机设备,包括存储器、处理器以及存储在存储器上被处理器执行的计算机程序,处理器执行计算机程序时实现如上述任一实施例提供的文档图像矫正方法的步骤和/或上述任一实施例提供的文档图像矫正模型的训练方法的步骤。
[0011]本申请第六方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一实施例提供的文档图像矫正方法的步骤和/或上述任一实施例提供的文档图像矫正模型的训练方法的步骤。
附图说明
[0012]图1为本申请实施例提供的文档图像的示意图。
[0013]图2为本申请一实施例提供的文档图像矫正模型的架构图。
[0014]图3为本申请一实施例提供的文档图像矫正方法的流程图。
[0015]图4为本申请一实施例提供的矫正矩阵的确定过程示意图。
[0016]图5为本申请一实施例提供的文档图像的矫正过程示意图。
[0017]图6为本申请第一实施例提供的文档图像矫正模型的训练方法的流程图。
[0018]图7为本申请第二实施例提供的文档图像矫正模型的训练方法的流程图。
[0019]图8为本申请一实施例提供的文档图像矫正装置的结构框图。
[0020]图9为本申请一实施例提供的文档图像矫正模型的训练装置的结构框图。
[0021]图10为本申请一实施例提供的计算机设备的结构框图。
具体实施方式
[0022]银行、证券等金融公司的业务场景中存在大量的卡证、票据、表单等数据。在实际业务中,需要将这些数据录入到系统。目前,在OCR场景下,一些常见的卡证(身份证、银行卡、营业执照)的标准件上的文字已经能够被准确地识别出来,例如通过扫描方式获得的文档图片。然而,如
技术介绍
中提到的,有些文档图片的质量较差,导致OCR的准确率较低。
[0023]图1为本申请实施例提供的文档图像的示意图。如图1所示,在当前业务场景下,智能终端需要对纸质文档进行拍照以获取纸质文档的电子版文档。在拍照过程中,因为拍摄角度和范围的把控不当,实际拍摄效果如图1所示。参阅图1,纸质文档110在电子版文档图像120中发生了明显变形和倾斜,纸质文档110边缘显示不全,并且纸质文档110周围存在背景区域Q。这本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档图像矫正方法,其特征在于,包括:确定文档图像的降噪图像、偏转角度和所述文档图像中文档的角点坐标,所述偏转角度用于指示所述文档在所述文档图像中的倾斜角度;基于所述偏转角度、所述角点坐标和预设标准文档确定矫正矩阵;基于所述降噪图像、所述偏转角度和所述矫正矩阵确定输出图像。2.根据权利要求1所述的文档图像矫正方法,其特征在于,所述确定文档图像的降噪图像、偏转角度和所述文档图像中文档的角点坐标包括:对所述文档图像进行特征提取,得到多个特征表示向量;基于所述多个特征表示向量进行角度分类,得到所述偏转角度;基于所述多个特征表示向量确定预测图像;基于所述预测图像确定所述降噪图像和所述角点坐标。3.根据权利要求2所述的文档图像矫正方法,其特征在于,所述预测图像和所述文档图像的维度相同;所述基于所述预测图像确定所述降噪图像和所述角点坐标包括:确定所述预测图像为所述降噪图像;对所述降噪图像中所述文档的角点进行定位,得到所述角点坐标。4.根据权利要求1

3中任一项所述的文档图像矫正方法,其特征在于,所述基于所述偏转角度、所述角点坐标和预设标准文档确定矫正矩阵包括:基于所述偏转角度对所述预设标准文档进行旋转,以使所述预设标准文档的阅读方向和所述文档的阅读方向一致,得到目标文档;基于所述角点坐标和所述目标文档的目标角点坐标确定所述矫正矩阵。5.根据权利要求1

3中任一项所述的文档图像矫正方法,其特征在于,所述基于所述降噪图像、所述偏转角度和所述矫正矩阵确定输出图像包括:基于所述矫正矩阵对所述降噪图像进行矫正,得到中间图像;基于所述偏转角度对所述中间图像进行矫正,得到所述输出图像。6.一种文档图像矫正模型的训练方法,其特征在于,包括:确定文档图像的降噪图像、偏转角度和所述文档图像中文档的角点坐标,所述文档图像标注有噪声标签、偏转角度标签和所述文档的角点...

【专利技术属性】
技术研发人员:张秋晖范峻植周迅溢蒋宁
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1