用于从图像中提取目标文档部分的方法、设备和介质技术

技术编号：37067608 阅读：19 留言：0更新日期：2023-03-29 19:45

本公开的实施例涉及用于从图像中提取目标文档部分的方法、设备和介质。根据该方法，获取待处理图像，该待处理图像具有目标文档部分和背景部分；对待处理图像进行二值化处理，以便对经二值化处理的待处理图像分别进行第一滤波处理以及第二滤波处理，以分别得到第一图像和第二图像，其中第一图像比第二图像具有更少的噪声，第二图像比第一图像具有更高的锐度；基于第一图像，确定目标文档部分的四个角点的坐标；以及基于所确定的四个角点的坐标，从第二图像中提取目标文档部分。由此，能够准确并高效地从图像中提取出清晰可用的目标文档部分。档部分。档部分。

全部详细技术资料下载

【技术实现步骤摘要】
用于从图像中提取目标文档部分的方法、设备和介质

[0001]本公开的实施例总体涉及图像处理领域，并且更具体地涉及一种用于从图像中提取目标文档部分的方法、设备和介质。

技术介绍

[0002]在用诸如相机之类的图像捕捉设备来捕捉文档的图像时，所捕捉到的图像中通常会包括关于该文档的文档部分以及关于放置该文档的周围环境(例如桌面)的背景部分，并且这些图像通常还可包括阴影(例如，周围环境的影子等)、扭曲、边缘模糊或光线阴暗等各种失真，从而对于从该图像中准确地提取出文档部分造成了很大干扰。目前，通常需要用户手动地从这样的图像中提取所需的文档部分，但是这样效率过低，而且由于前面提到的各种失真，使得用户很难准确地找出目标文档在这样的图像中的精确边框，因此很难准确地提取出完全没有背景部分的目标文档。并且，用户通常在提取出相应的目标文档之后，才能对其进行失真处理，从而导致处理效率的进一步降低。
[0003]因此，有必要提供一种自动从图像中提取目标文档部分的技术，以能够准确并高效地从图像中提取出清晰可用的文档部分。

技术实现思路

[0004]针对上述问题，本公开提供了一种用于从图像中提取目标文档部分的方法、设备和介质，使得能够准确并高效地从图像中提取出清晰可用的文档部分。
[0005]根据本公开的第一方面，提供了一种用于从图像中提取目标文档部分的方法，包括：获取待处理图像，所述待处理图像具有目标文档部分和背景部分；对所述待处理图像进行二值化处理，以便对经二值化处理的待处理图像分别进行第一滤波处理以及第二滤波...

【技术保护点】

【技术特征摘要】
1.一种用于从图像中提取目标文档部分的方法，包括：获取待处理图像，所述待处理图像具有目标文档部分和背景部分；对所述待处理图像进行二值化处理，以便对经二值化处理的待处理图像分别进行第一滤波处理以及第二滤波处理，以分别得到第一图像和第二图像，其中第一图像比第二图像具有更少的噪声，第二图像比第一图像具有更高的锐度；基于第一图像，确定目标文档部分的四个角点的坐标；以及基于所确定的四个角点的坐标，从第二图像中提取目标文档部分。2.根据权利要求1所述的方法，其中所述第一滤波处理为中值滤波，并且所述第二滤波处理为双边滤波。3.根据权利要求1所述的方法，基于第一图像，确定目标文档部分的四个角点的坐标包括：基于第一图像，确定所述目标文档部分的倾斜度；基于所述倾斜度对第一图像进行旋转，以得到具有经倾斜校正的目标文档部分的第三图像；对第三图像进行边缘检测，以初步确定经倾斜校正的目标文档部分的四条边框线；以及对第三图像进行连通区域分析，以便基于从第三图像中确定的多个连通区域以及初步确定的四条边框线，确定经倾斜校正的目标文档部分的四个角点的坐标。4.根据权利要求3所述的方法，基于所确定的四个角点的坐标，从第二图像中提取目标文档部分包括：基于所述倾斜度对第二图像进行旋转，以得到具有经倾斜校正的目标文档部分的第四图像；基于所确定的四个角点的坐标，确定经倾斜校正的目标文档部分在所述第四图像中的边框；以及利用透视变换，基于所确定的边框以及所述第四图像本身的边框，对所述第四图像进行仿射变换，以从所述第四图像中提取出仅包括经倾斜校正的目标文档部分的图像，并将所提取的图像放大为水平宽度等于所述第四图像的最小外接矩形的水平宽度。5.根据权利要求3所述的方法，其中基于第一图像，确定所述目标文档部分的倾斜度包括：在第一图像中检测直线，以便通过确定检测出的直线中的横向直线相对于第一图像的水平边框的倾斜角来确定所述目标文档部分的倾斜度；或者在第一图像中检测直线，以便通过确定检测出的直线中的纵向直线相对于第一图像的垂直边框的倾斜角来确定所述目标文档部分的倾斜度。6.根据权利要求3所述的方法，其中基于从第三图像中确定的多个连通区域以及初步确定的四条边框线，确定经倾斜校正的目标文档部分的四个角点的坐标包括：如果所述多个连通区域中的最大连通区域的面积与所述第三图像的面积之比大于预定的第一比例，则确定所述最大连通区域的最小外接矩形的四个角点的坐标；如果所述最大连通区域的最小外接矩形的四个角点中的至少一个角点位于所述最大连通区域之外，使用所述最大连通区域内与该角点距离最近的点来替换该角点；
将最终得到的四个点的坐标作为经倾斜校正的目标文档部分的四个角点的坐标。7.根据权利要求6所述的方法，其中基于从第三图像中确定的多个连通区域以及初步确定的四条边框线，确定经倾斜校正的目标文档部分的四个角点的坐标还包括：如果所述最大连通...

【专利技术属性】
技术研发人员：李国政，
申请(专利权)人：中国建设银行股份有限公司上海市分行，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人