【技术实现步骤摘要】
图像处理装置和方法
本公开总体上涉及图像处理领域,具体而言,涉及对包含文本的图像进行处理的图像处理装置和方法。
技术介绍
目前,对包含文本的图像进行处理的技术正受到越来越多的关注。这样的技术可以包括诸如光学字符识别(OCR)的文本识别技术,并且更一般地包括与文本处理有关的各种图像处理技术。通过这些图像处理技术所得到的图像处理结果(例如文本识别结果)可以有利于帮助用户定位、识别、标注、检索、分类、或搜索文档中的内容。然而,由于包含文本的图像可能具有复杂背景以及不同的文本方向,并且图像本身可能属于低质量的文档图像,因此导致对包含文本内容的图像的处理通常耗费大量的时间和系统资源。因此,期望能够提高对包含文本内容的图像的处理效率。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。鉴于现有技术的上述缺陷,本专利技术的目的之一是提供 ...
【技术保护点】
一种图像处理装置,包括:构建单元,用于根据预定约束、按照预定方向以有向边连接待处理图像中的连通部件,以构建有向图;以及获取单元,用于基于所述有向图中的有向边获取所述待处理图像中的文本行,以便用于后续的文本处理,其中,对于任意两个连通部件,所述预定约束包括与所述两个连通部件之间的距离有关的距离约束以及与所述两个连通部件在所述预定方向上的重叠度有关的重叠度约束。
【技术特征摘要】
1.一种图像处理装置,包括:构建单元,用于根据预定约束、按照预定方向以有向边连接待处理图像中的连通部件,以构建有向图;以及获取单元,用于基于所述有向图中的有向边获取所述待处理图像中的文本行,以便用于后续的文本处理,其中,对于任意两个连通部件,所述预定约束包括与所述两个连通部件之间的距离有关的距离约束以及与所述两个连通部件在所述预定方向上的重叠度有关的重叠度约束。2.如权利要求1所述的图像处理装置,其中,所述预定方向基于阅读方向,尤其是从上到下的方向和从左到右的方向。3.如权利要求1所述的图像处理装置,其中,所述预定方向包括多个预定方向;以及两个连通部件的所述重叠度约束包括多个重叠度约束,其中每个重叠度约束与所述两个连通部件在所述多个预定方向中的一个预定方向上的重叠度有关。4.如权利要求3所述的图像处理装置,其中,所述构建单元被配置为通过下述方式获得从当前连通部件出发的有向边:获得满足与当前连通部件的所述距离约束以及与当前连通部件的所述多个重叠度约束中的一个重叠度约束的候选连通部件;针对所述多个预定方向中的每个预定方向,在所述候选连通部件当中,获得在该预定方向上与当前连通部件距离最近的最近连通部件,以及在所述候选连通部件当中,获得附加连通部件,所述附加连通部件与所述最近连通部件在所述多个预定方向中的其他预定方向上满足相应的重叠度约束;以及构建从当前连通部件出发、分别指向针对所述多个预定方向获得的最近连通部件和附加连通部件的有向边。5.如权利要求1所述的图像处理装置,其中,所述获取单元被配置为针对所述有向图中的有向边设置有向边代价函数,并基于所述有向边代价函数获取所述待处理图像中的文本行。6.如权利要求5所述的图像处理装置,其中,所述获取单元进一步被配置为对所述有向图中的每个有向边设置基于下述中的至少一者的有向边代价函数:单一代价函...
【专利技术属性】
技术研发人员:汪留安,范伟,孙俊,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。