用于从图像中提取目标文档部分的方法、设备和介质技术

技术编号:37067608 阅读:19 留言:0更新日期:2023-03-29 19:45
本公开的实施例涉及用于从图像中提取目标文档部分的方法、设备和介质。根据该方法,获取待处理图像,该待处理图像具有目标文档部分和背景部分;对待处理图像进行二值化处理,以便对经二值化处理的待处理图像分别进行第一滤波处理以及第二滤波处理,以分别得到第一图像和第二图像,其中第一图像比第二图像具有更少的噪声,第二图像比第一图像具有更高的锐度;基于第一图像,确定目标文档部分的四个角点的坐标;以及基于所确定的四个角点的坐标,从第二图像中提取目标文档部分。由此,能够准确并高效地从图像中提取出清晰可用的目标文档部分。档部分。档部分。

【技术实现步骤摘要】
用于从图像中提取目标文档部分的方法、设备和介质


[0001]本公开的实施例总体涉及图像处理领域,并且更具体地涉及一种用于从图像中提取目标文档部分的方法、设备和介质。

技术介绍

[0002]在用诸如相机之类的图像捕捉设备来捕捉文档的图像时,所捕捉到的图像中通常会包括关于该文档的文档部分以及关于放置该文档的周围环境(例如桌面)的背景部分,并且这些图像通常还可包括阴影(例如,周围环境的影子等)、扭曲、边缘模糊或光线阴暗等各种失真,从而对于从该图像中准确地提取出文档部分造成了很大干扰。目前,通常需要用户手动地从这样的图像中提取所需的文档部分,但是这样效率过低,而且由于前面提到的各种失真,使得用户很难准确地找出目标文档在这样的图像中的精确边框,因此很难准确地提取出完全没有背景部分的目标文档。并且,用户通常在提取出相应的目标文档之后,才能对其进行失真处理,从而导致处理效率的进一步降低。
[0003]因此,有必要提供一种自动从图像中提取目标文档部分的技术,以能够准确并高效地从图像中提取出清晰可用的文档部分。

技术实现思路

[0004]针对上述问题,本公开提供了一种用于从图像中提取目标文档部分的方法、设备和介质,使得能够准确并高效地从图像中提取出清晰可用的文档部分。
[0005]根据本公开的第一方面,提供了一种用于从图像中提取目标文档部分的方法,包括:获取待处理图像,所述待处理图像具有目标文档部分和背景部分;对所述待处理图像进行二值化处理,以便对经二值化处理的待处理图像分别进行第一滤波处理以及第二滤波处理,以分别得到第一图像和第二图像,其中第一图像比第二图像具有更少的噪声,第二图像比第一图像具有更高的锐度;基于第一图像,确定目标文档部分的四个角点的坐标;以及基于所确定的四个角点的坐标,从第二图像中提取目标文档部分。
[0006]根据本公开的第二方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的第一方面的方法。
[0007]在本公开的第三方面中,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机本公开的第一方面的方法。
[0008]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0009]结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面
将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素。
[0010]图1示出了用于实现根据本公开的实施例的用于从图像中提取目标文档部分的方法的示例性系统100的示意图。
[0011]图2示出了根据本公开的实施例的用于从图像中提取目标文档部分的方法200的流程图。
[0012]图3示出了根据本公开的实施例的用于基于经第一滤波处理得到的第一图像确定目标文档部分的四个角点的坐标的方法300的流程图。
[0013]图4示出了根据本公开的实施例的用于从经第二滤波处理得到的第二图像中提取目标文档部分的方法400的流程图。
[0014]图5示出了根据本公开的实施例的用于确定经倾斜校正的目标文档部分的四个角点的坐标的方法500的流程图。
[0015]图6A示出了根据本公开的实施例的经二值化处理的示例性待处理图像的示意图;
[0016]图6B示出了根据本公开的实施例的示例性第三图像的示意图。
[0017]图6C示出了根据本公开的实施例的示例性第四图像的示意图。
[0018]图6D示出了根据本公共的实施例的最终提取出的目标文档部分的示意图。
[0019]图7示出了根据本公开的实施例的电子设备700的框图。
具体实施方式
[0020]下面将参照附图更详细地描述本专利技术的优选实施方式。虽然附图中显示了本专利技术的优选实施方式,然而应该理解,可以以各种形式实现本专利技术而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本专利技术更加透彻和完整,并且能够将本专利技术的范围完整的传达给本领域的技术人员。
[0021]在下文的描述中,出于说明各种专利技术的实施例的目的阐述了某些具体细节以提供对各种专利技术实施例的透彻理解。但是,相关领域技术人员将认识到可在无这些具体细节中的一个或多个细节的情况来实践实施例。在其它情形下,与本申请相关联的熟知的装置、结构和技术可能并未详细地示出或描述从而避免不必要地混淆实施例的描述。
[0022]除非语境有其它需要,在整个说明书和权利要求中,词语“包括”和其变型,诸如“包含”和“具有”应被理解为开放的、包含的含义,即应解释为“包括,但不限于”。
[0023]在整个说明书中对“一个实施例”或“一些实施例”的提及表示结合实施例所描述的特定特点、结构或特征包括于至少一个实施例中。因此,在整个说明书的各个位置“在一个实施例中”或“在一些实施例”中的出现不一定全都指相同实施例。另外,特定特点、结构或特征可在一个或多个实施例中以任何方式组合。
[0024]此外,说明书和权利要求中所用的第一、第二、第三、第四等术语,仅仅出于描述清楚起见来区分各个对象,而并不限定其所描述的对象的大小或其他顺序等。
[0025]如上所述,在通过诸如相机之类的图像捕捉设备来捕捉文档的图像时,所捕捉到的图像中通常会包括关于该文档的文档部分以及关于放置该文档的周围环境(例如桌面)的背景部分,并且这些图像通常还可包括阴影(例如,周围环境的影子等)、扭曲、边缘模糊或光线阴暗等各种失真,从而对于从该图像中准确地提取出文档部分造成了很大干扰。目前一般由用户手动从这样的图像中提取所需的文档部分,但是这样效率过低,而且由于前
面提到的各种失真,使得用户很难准确地找出目标文档在这样的图像中的精确边框,因此很难准确地提取出完全没有背景部分的目标文档。并且,用户通常会在提取出相应的目标文档之后,才对其进行失真处理,从而导致处理效率的进一步降低。
[0026]为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个,本公开的示例实施例提出了一种用于从图像中提取目标文档部分的方法,包括:获取待处理图像,所述待处理图像具有目标文档部分和背景部分;对所述待处理图像进行二值化处理,以便对经二值化处理的待处理图像分别进行第一滤波处理以及第二滤波处理,以分别得到第一图像和第二图像,其中第一图像比第二图像具有更少的噪声,第二图像比第一图像具有更高的锐度;基于第一图像,确定目标文档部分的四个角点的坐标;以及基于所确定的四个角点的坐标,从第二图像中提取目标文档部分。以此方式,能够准确并高效地从图像中提取出清晰可用的目标文档部分。
[0027]在下文中,将结合附图更详细地描述本方案的具体示例。
[0028]图1示出了用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于从图像中提取目标文档部分的方法,包括:获取待处理图像,所述待处理图像具有目标文档部分和背景部分;对所述待处理图像进行二值化处理,以便对经二值化处理的待处理图像分别进行第一滤波处理以及第二滤波处理,以分别得到第一图像和第二图像,其中第一图像比第二图像具有更少的噪声,第二图像比第一图像具有更高的锐度;基于第一图像,确定目标文档部分的四个角点的坐标;以及基于所确定的四个角点的坐标,从第二图像中提取目标文档部分。2.根据权利要求1所述的方法,其中所述第一滤波处理为中值滤波,并且所述第二滤波处理为双边滤波。3.根据权利要求1所述的方法,基于第一图像,确定目标文档部分的四个角点的坐标包括:基于第一图像,确定所述目标文档部分的倾斜度;基于所述倾斜度对第一图像进行旋转,以得到具有经倾斜校正的目标文档部分的第三图像;对第三图像进行边缘检测,以初步确定经倾斜校正的目标文档部分的四条边框线;以及对第三图像进行连通区域分析,以便基于从第三图像中确定的多个连通区域以及初步确定的四条边框线,确定经倾斜校正的目标文档部分的四个角点的坐标。4.根据权利要求3所述的方法,基于所确定的四个角点的坐标,从第二图像中提取目标文档部分包括:基于所述倾斜度对第二图像进行旋转,以得到具有经倾斜校正的目标文档部分的第四图像;基于所确定的四个角点的坐标,确定经倾斜校正的目标文档部分在所述第四图像中的边框;以及利用透视变换,基于所确定的边框以及所述第四图像本身的边框,对所述第四图像进行仿射变换,以从所述第四图像中提取出仅包括经倾斜校正的目标文档部分的图像,并将所提取的图像放大为水平宽度等于所述第四图像的最小外接矩形的水平宽度。5.根据权利要求3所述的方法,其中基于第一图像,确定所述目标文档部分的倾斜度包括:在第一图像中检测直线,以便通过确定检测出的直线中的横向直线相对于第一图像的水平边框的倾斜角来确定所述目标文档部分的倾斜度;或者在第一图像中检测直线,以便通过确定检测出的直线中的纵向直线相对于第一图像的垂直边框的倾斜角来确定所述目标文档部分的倾斜度。6.根据权利要求3所述的方法,其中基于从第三图像中确定的多个连通区域以及初步确定的四条边框线,确定经倾斜校正的目标文档部分的四个角点的坐标包括:如果所述多个连通区域中的最大连通区域的面积与所述第三图像的面积之比大于预定的第一比例,则确定所述最大连通区域的最小外接矩形的四个角点的坐标;如果所述最大连通区域的最小外接矩形的四个角点中的至少一个角点位于所述最大连通区域之外,使用所述最大连通区域内与该角点距离最近的点来替换该角点;
将最终得到的四个点的坐标作为经倾斜校正的目标文档部分的四个角点的坐标。7.根据权利要求6所述的方法,其中基于从第三图像中确定的多个连通区域以及初步确定的四条边框线,确定经倾斜校正的目标文档部分的四个角点的坐标还包括:如果所述最大连通...

【专利技术属性】
技术研发人员:李国政
申请(专利权)人:中国建设银行股份有限公司上海市分行
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1