System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文档矫正的方法、装置、电子设备及介质制造方法及图纸_技高网

文档矫正的方法、装置、电子设备及介质制造方法及图纸

技术编号:40003760 阅读:12 留言:0更新日期:2024-01-09 04:24
本发明专利技术提供了一种文档矫正的方法、装置、电子设备及介质,包括:获取待矫正文档图像;对待矫正文档图像进行目标检测,得到文档区域图像;对文档区域图像进行边缘检测,得到文档区域的边缘像素点;基于边缘像素点计算文档区域的顶点;基于文档区域的顶点进行透视变换矫正,得到拉伸后的矩形文档区域图像;对矩形文档区域图像进行方向分类,得到矩形文档区域图像的文档方向;基于文档方向将矩形文档区域图像进行旋转得到矫正后的文档图像。本发明专利技术提高了文档矫正方法的通用性以及抗背景干扰的能力。

【技术实现步骤摘要】

本专利技术涉及计算机视觉,尤其是涉及一种文档矫正的方法、装置、电子设备及介质


技术介绍

1、随着电子设备(尤其是智能手机)的普及,用手机拍摄获得文档图像成为了普遍的现象,如拍摄身份证件、银行卡、各类票据等用于信息提取。然而,由于用户拍照角度不同、相机畸变、纸张褶皱等因素,获取到的文档图像经常会出现不同程度的倾斜、扭曲等,为后续的文本识别带来了干扰,因此需要对文档图像矫正还原。

2、随着深度学习在图像领域的成功应用,一些研究人员尝试利用深度学习技术实现文档矫正并取得了一定成果,然而由于文档的多样性、文档可能存在扭曲形变以及背景因素干扰等原因,使得该问题的解决具有较大的挑战性,现有的解决方案难以做到通用性且容易受背景干扰。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种文档矫正的方法、装置、电子设备及介质,以提高了文档矫正方法的通用性以及抗背景干扰的能力。

2、为了实现上述目的,本专利技术实施例采用的技术方案如下:

3、第一方面,本专利技术实施例提供了一种文档矫正的方法,包括:获取待矫正文档图像;对待矫正文档图像进行目标检测,得到文档区域图像;对文档区域图像进行边缘检测,得到文档区域的边缘像素点;基于边缘像素点计算文档区域的顶点;基于文档区域的顶点进行透视变换矫正,得到拉伸后的矩形文档区域图像;对矩形文档区域图像进行方向分类,得到矩形文档区域图像的文档方向;基于文档方向将矩形文档区域图像进行旋转得到矫正后的文档图像。

4、在一种实施方式中,对待矫正文档图像进行目标检测,得到文档区域图像,包括:基于预先训练好的目标检测模型,采用矩形框对待矫正文档图像进行标注;基于预设比例对标注后的待矫正文档图像进行裁剪,得到文档区域图像。

5、在一种实施方式中,对文档区域图像进行边缘检测,得到文档区域的边缘像素点,包括:基于边缘检测模型对文档区域图像的边缘进行标注,得到文档区域的边缘像素点;其中,边缘检测模型采用hed模型结构,包括:边缘检测分支和文档区域分割分支。

6、在一种实施方式中,基于边缘检测模型对文档区域图像的边缘进行标注,得到文档区域的边缘像素点,包括:将文档区域图像输入到边缘检测模型中,得到边缘检测分支掩码和文档区域分割分支掩码;将边缘检测分支掩码和文档区域分割分支掩码的交集确定为文档区域的边缘像素点。

7、在一种实施方式中,基于边缘像素点计算文档区域的顶点,包括:基于边缘像素点提取文档区域的外轮廓点,得到多个轮廓;将多个轮廓中面积最大的轮廓确定为文档区域的轮廓;基于文档区域的轮廓的外轮廓点计算凸包,并计算凸包的近似多边形;基于凸包的近似多边形计算文档区域的顶点。

8、在一种实施方式中,基于凸包的近似多边形计算文档区域的顶点,包括:如果凸包的近似多边形为四边形,则将四边形的顶点确定为文档区域的顶点;如果凸包的近似多边形不是四边形,则计算凸包的最小外接矩形,并将最小外接矩形的顶点确定为文档区域的顶点。

9、在一种实施方式中,对矩形文档区域图像进行方向分类,得到矩形文档区域图像的文档方向,包括:将矩形文档区域图像输入到预先训练好的文档方向分类模型中,得到矩形文档区域图像的文档方向;其中,文档方向至少包括:0度、90度、180度和270度。

10、第二方面,本专利技术实施例提供了一种文档矫正的装置,包括:图像获取模块,用于获取待矫正文档图像;目标检测模块,用于对待矫正文档图像进行目标检测,得到文档区域图像;边缘检测模块,用于对文档区域图像进行边缘检测,得到文档区域的边缘像素点;顶点计算模块,用于基于边缘像素点计算文档区域的顶点;透视变换模块,用于基于文档区域的顶点进行透视变换矫正,得到拉伸后的矩形文档区域图像;方向分类模块,用于对矩形文档区域图像进行方向分类,得到矩形文档区域图像的文档方向;图像旋转模块,用于基于文档方向将矩形文档区域图像进行旋转得到矫正后的文档图像。

11、第三方面,本专利技术实施例提供了一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述第一方面提供的任一项的方法的步骤。

12、第四方面,本专利技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述第一方面提供的任一项的方法的步骤。

13、本专利技术实施例带来了以下有益效果:

14、本专利技术实施例提供的上述一种文档矫正的方法、装置、电子设备及介质,包括:获取待矫正文档图像;对待矫正文档图像进行目标检测,得到文档区域图像;对文档区域图像进行边缘检测,得到文档区域的边缘像素点;基于边缘像素点计算文档区域的顶点;基于文档区域的顶点进行透视变换矫正,得到拉伸后的矩形文档区域图像;对矩形文档区域图像进行方向分类,得到矩形文档区域图像的文档方向;基于文档方向将矩形文档区域图像进行旋转得到矫正后的文档图像。上述方法通过对待矫正文档图像进行目标检测,能够过滤掉图像中的背景,提高了抗背景干扰的能力;其次,通过进行边缘检测提取文档边缘,对扭曲、褶皱的文档边缘具有较好的处理能力;最后,先通过透视变换矫正将文档图像矫正至矩形,再对矩形文档区域图像进行方向分类,最后将矩形文档区域图像进行旋转得到矫正后的文档图像,提高了文档矫正的准确性。

15、本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

16、为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

本文档来自技高网...

【技术保护点】

1.一种文档矫正的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,对所述待矫正文档图像进行目标检测,得到文档区域图像,包括:

3.根据权利要求1所述的方法,其特征在于,对所述文档区域图像进行边缘检测,得到文档区域的边缘像素点,包括:

4.根据权利要求3所述的方法,其特征在于,基于边缘检测模型对所述文档区域图像的边缘进行标注,得到文档区域的边缘像素点,包括:

5.根据权利要求1所述的方法,其特征在于,基于所述边缘像素点计算所述文档区域的顶点,包括:

6.根据权利要求5所述的方法,其特征在于,基于所述凸包的近似多边形计算所述文档区域的顶点,包括:

7.根据权利要求1所述的方法,其特征在于,对所述矩形文档区域图像进行方向分类,得到所述矩形文档区域图像的文档方向,包括:

8.一种文档矫正的装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至7任一项所述的方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至7任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种文档矫正的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,对所述待矫正文档图像进行目标检测,得到文档区域图像,包括:

3.根据权利要求1所述的方法,其特征在于,对所述文档区域图像进行边缘检测,得到文档区域的边缘像素点,包括:

4.根据权利要求3所述的方法,其特征在于,基于边缘检测模型对所述文档区域图像的边缘进行标注,得到文档区域的边缘像素点,包括:

5.根据权利要求1所述的方法,其特征在于,基于所述边缘像素点计算所述文档区域的顶点,包括:

6.根据权利要求5所述的方法,其特征在于,基于所述凸包的近似多...

【专利技术属性】
技术研发人员:毛秀萍王友金关济雨
申请(专利权)人:苏州创旅天下信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1