图像处理装置和方法制造方法及图纸

技术编号:15640412 阅读:113 留言:0更新日期:2017-06-16 05:45
本公开提供了图像处理装置和方法。图像处理装置包括:构建单元,用于根据预定约束、按照预定方向以有向边连接待处理图像中的连通部件,以构建有向图;以及获取单元,用于基于所述有向图中的有向边获取所述待处理图像中的文本行,以便用于后续的文本处理,其中,对于任意两个连通部件,所述预定约束包括与所述两个连通部件之间的距离有关的距离约束以及与所述两个连通部件在所述预定方向上的重叠度有关的重叠度约束。

【技术实现步骤摘要】
图像处理装置和方法
本公开总体上涉及图像处理领域,具体而言,涉及对包含文本的图像进行处理的图像处理装置和方法。
技术介绍
目前,对包含文本的图像进行处理的技术正受到越来越多的关注。这样的技术可以包括诸如光学字符识别(OCR)的文本识别技术,并且更一般地包括与文本处理有关的各种图像处理技术。通过这些图像处理技术所得到的图像处理结果(例如文本识别结果)可以有利于帮助用户定位、识别、标注、检索、分类、或搜索文档中的内容。然而,由于包含文本的图像可能具有复杂背景以及不同的文本方向,并且图像本身可能属于低质量的文档图像,因此导致对包含文本内容的图像的处理通常耗费大量的时间和系统资源。因此,期望能够提高对包含文本内容的图像的处理效率。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。鉴于现有技术的上述缺陷,本专利技术的目的之一是提供一种能够快速、准确地对包含任意方向、排列方向文本的图像进行处理的图像处理方法和装置,以至少克服现有的问题。根据本公开的一个方面,提供了一种图像处理装置,包括:构建单元,用于根据预定约束、按照预定方向以有向边连接待处理图像中的连通部件,以构建有向图;以及获取单元,用于基于所述有向图中的有向边获取所述待处理图像中的文本行,以便用于后续的文本处理,其中,对于任意两个连通部件,所述预定约束包括与所述两个连通部件之间的距离有关的距离约束以及与所述两个连通部件在所述预定方向上的重叠度有关的重叠度约束。根据本公开的另一方面,提供了一种图像处理方法,包括:根据预定约束、按照预定方向以有向边连接待处理图像中的连通部件,以构建有向图;以及基于所述有向图中的有向边获取所述待处理图像中的文本行,以便用于后续的文本处理,其中,对于任意两个连通部件,所述预定约束包括与所述两个连通部件之间的距离有关的距离约束以及与所述两个连通部件在所述预定方向上的重叠度有关的重叠度约束。依据本公开的其它方面,还提供了一种使得计算机用作如上所述的图像处理装置的程序。依据本公开的又一方面,还提供了相应的计算机可读存储介质,该计算机可读存储介质上存储有能够由计算设备执行的计算机程序,该计算机程序在执行时能够使计算设备执行上述图像处理方法。上述根据本公开实施例的各个方面,至少能够获得以下益处:利用本公开所提供的图像处理方法和装置,能够快速、准确地获取图像中的文本行,以便用于后续的文本处理。通过以下结合附图对本公开的最佳实施例的详细说明,本公开的这些以及其他优点将更加明显。附图说明本公开可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本公开的优选实施例和解释本公开的原理和优点。其中:图1是示意性地示出根据本公开实施例的图像处理装置的示例结构的框图。图2是用于说明根据本公开实施例的图像处理装置的构建单元所进行的示例处理的说明图。图3是用于说明根据本公开实施例的图像处理装置的构建单元和获取单元所进行的示例处理的说明图。图4是用于说明根据本公开实施例的图像处理装置的获取单元所进行的示例处理的说明图。图5是示意性地示出根据本公开实施例的图像处理方法的示例流程的流程图。图6是示出了可用来实现根据本公开实施例的图像处理装置和方法的一种可能的硬件配置的结构简图。具体实施方式在下文中将结合附图对本专利技术的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本专利技术,在附图中仅仅示出了与根据本专利技术的方案密切相关的装置结构和/或处理步骤,而省略了与本专利技术关系不大的其他细节。在面对包含文本内容的图像时,期望能够得到图像中的文本行,以便利于利用文本行进行后续处理。基于此,本公开提出了一种图像处理方法和图像处理装置,其能够基于待处理图像中的连通部件构建有向图,并基于有向图获得待处理图像中的文本行,从而能够快速、准确地从包含任意排列方向的文本的图像中获取文本行以便用于后续的文本处理。根据本公开的一个方面,提供了一种图像处理装置。图1是示意性地示出根据本公开实施例的图像处理装置100的示例结构的框图。如图1所示,图像处理装置100包括:构建单元101,用于根据预定约束、按照预定方向以有向边连接待处理图像中的连通部件,以构建有向图;以及获取单元102,用于基于所述有向图中的有向边获取所述待处理图像中的文本行,以便用于后续的文本处理,其中,对于任意两个连通部件,所述预定约束包括与所述两个连通部件之间的距离有关的距离约束以及与所述两个连通部件在所述预定方向上的重叠度有关的重叠度约束。可以通过可选的预处理利用构建单元101获得待处理图像中的连通部件,也可以从图像处理装置100外部向构建单元101提供待处理图像中的连通部件。可以利用各种已知方式获得待处理图像中的连通部件,例如最大稳定极值区域(MSER)方法等,在此不进行详细描述。构建单元101连接连通部件时所参照的预定约束用于避免连通部件之间的不必要的连接。作为示例,距离约束可以是两个连通部件mi,mj之间的距离满足下述公式(1)。dist(mi,mj)<k*min(max(wi,hi),max(wj,hj))公式(1)其中,dist(·,·)可以是两个连通部件的中心点之间的距离(即,两个连通部件各自的外接矩形框的中心之间的距离),wi,hi和wj,hj分别是连通部件mi,mj各自的外接矩形框的宽度和高度,其中,i、j是自然数,k可以是预先设置的调整因子。在一个示例中,可以将k设置为1。作为示例,重叠度约束可以是两个连通部件在预定方向上的重叠度大于预定的重叠度阈值。可以根据应用要求来设置合适的重叠度阈值。例如,可以设置约(0-10%)重叠度阈值。基于构建单元101所构建的有向图中的有向边,获取单元102可以获取待处理图像中的文本行,以便用于后续的文本处理。利用例如上述的构建单元101和获取单元102,图像处理装置100能够基于待处理图像中的连通部件构建有向图,并基于有向图获得待处理图像中的文本行。与使用全向图等的现有技术方案相比,根据本公开实施例的图像处理装置100根据距离约束和重叠度约束构建有向图、并根据有向图获得文本行的处理有效降低了计算复杂度,从而降低了处理所耗费的时间和系统资源,能够快速、准确地获取文本行以便用于后续的文本处理。在一个优选实施例中,当构建单元101连接待处理图像中的连通部件时,所参本文档来自技高网...
图像处理装置和方法

【技术保护点】
一种图像处理装置,包括:构建单元,用于根据预定约束、按照预定方向以有向边连接待处理图像中的连通部件,以构建有向图;以及获取单元,用于基于所述有向图中的有向边获取所述待处理图像中的文本行,以便用于后续的文本处理,其中,对于任意两个连通部件,所述预定约束包括与所述两个连通部件之间的距离有关的距离约束以及与所述两个连通部件在所述预定方向上的重叠度有关的重叠度约束。

【技术特征摘要】
1.一种图像处理装置,包括:构建单元,用于根据预定约束、按照预定方向以有向边连接待处理图像中的连通部件,以构建有向图;以及获取单元,用于基于所述有向图中的有向边获取所述待处理图像中的文本行,以便用于后续的文本处理,其中,对于任意两个连通部件,所述预定约束包括与所述两个连通部件之间的距离有关的距离约束以及与所述两个连通部件在所述预定方向上的重叠度有关的重叠度约束。2.如权利要求1所述的图像处理装置,其中,所述预定方向基于阅读方向,尤其是从上到下的方向和从左到右的方向。3.如权利要求1所述的图像处理装置,其中,所述预定方向包括多个预定方向;以及两个连通部件的所述重叠度约束包括多个重叠度约束,其中每个重叠度约束与所述两个连通部件在所述多个预定方向中的一个预定方向上的重叠度有关。4.如权利要求3所述的图像处理装置,其中,所述构建单元被配置为通过下述方式获得从当前连通部件出发的有向边:获得满足与当前连通部件的所述距离约束以及与当前连通部件的所述多个重叠度约束中的一个重叠度约束的候选连通部件;针对所述多个预定方向中的每个预定方向,在所述候选连通部件当中,获得在该预定方向上与当前连通部件距离最近的最近连通部件,以及在所述候选连通部件当中,获得附加连通部件,所述附加连通部件与所述最近连通部件在所述多个预定方向中的其他预定方向上满足相应的重叠度约束;以及构建从当前连通部件出发、分别指向针对所述多个预定方向获得的最近连通部件和附加连通部件的有向边。5.如权利要求1所述的图像处理装置,其中,所述获取单元被配置为针对所述有向图中的有向边设置有向边代价函数,并基于所述有向边代价函数获取所述待处理图像中的文本行。6.如权利要求5所述的图像处理装置,其中,所述获取单元进一步被配置为对所述有向图中的每个有向边设置基于下述中的至少一者的有向边代价函数:单一代价函...

【专利技术属性】
技术研发人员:汪留安范伟孙俊
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1