封闭区域识别方法和设备技术

技术编号:11604475 阅读:96 留言:0更新日期:2015-06-17 01:54
本发明专利技术涉及封闭区域识别方法和设备,用于精确地识别文档中的封闭区域。该方法包括对包含封闭区域的输入图像进行二值化,以获得二值化图像;扫描二值化图像以确定候选区域;依次扫描候选区域内的每个点,通过以下方式向每一个点附加类别标号:扫描其相邻点,如果在其相邻点中存在已被分配有类别标号的点,则将所述相邻点的类别标号中最小的值分配给该点的类别标号;如果其相邻点中不存在已被分配有类别标号的点,则使类别标号值递增1,并将该新的类别标号值分配给该点的类别标号;以及将具有相同类别标号值的点识别为属于同一个区域。即使封闭区域彼此相连,根据本发明专利技术的方法仍然可以提取所有封闭区域,并且与对区域进行标记的线的形状和宽度无关。

【技术实现步骤摘要】

本专利技术涉及图像处理技术,更具体地,涉及封闭区域识别方法和设备
技术介绍
人们通常在阅读文档时对感兴趣的内容进行标记。因此,提出了一些方法,以提取文档中所标记区域。但是,一些方法无法精确地分离多个连通的区域。一些方法可以提取多个区域,但是当这些区域彼此连通时,无法精确地提取这些区域。其他一些方法基于图形方法来提取连通的封闭区域,但是这些方法也无法精确地提取封闭区域。还提出了一些方法,这些方法为了提取封闭区域可能需要知晓所标记区域的形状。一些提取方法仅适用于特定形状的区域。例如,一些方法仅能够提取矩形形状的区域。显然,这种限制对于用户而言不方便。近年来提出了一些方法,其假定所标记区域是通过直线构成的。但是,很难以确保用户所描绘的线是直线。这也限制了这些方法的应用。题为“User-enclosed Region Extraction From Scanned Document Images(从扫描文档图像中提取用户封闭区域)”的美国专利US6,351,559提出了一种从扫描文档图像中提取用户描绘的封闭区域的设备。其中,连通体分析器以位图格式分析文档,从而使得该设备能够检测可能存在的用户封闭区域,而无论文档图像的内容是什么。双向连通体模块使得用户可以用具有任何形状的标记来包围一个区域。用户所描绘的区域可以横跨文档页面上的文本行或图像。检测分析过滤器使用多个探索器来消除与用户所描绘的标记相似的小字符和图形。但是,该方法无法精确地提取封闭区域,也不支持多区域相连的情况。因此,需要一种能够精确地识别和提取文档的封闭区域的方法。
技术实现思路
本公开提出了一种封闭区域识别方法和设备,能够精确地识别和提取多个连通的封闭区域。根据本专利技术的一个方面,提出了一种封闭区域识别方法,该方法首先对包含一个或更多个封闭区域的输入图像进行二值化,以获得二值化图像。然后扫描二值化图像,通过以下方式,针对每行和每列确定候选区域:行的起始点和结束点分别是该行的第一个前景点和最后一个前景点,列的起始点和结束点分别是该列的第一个前景点和最后一个前景点,在所述候选区域内的点被称为候选点。然后,依次扫描每一个候选点,通过以下方式向每一个候选点附加类别标号:扫描其相邻点,如果在其相邻点中存在已被分配有类别标号的点,则将所述相邻点的类别标号中最小的值分配给该候选点的类别标号;如果其相邻点中不存在已被分配有类别标号的点,则使类别标号值递增1,并将该新的类别标号值分配给该候选点的类别标号。具有相同类别标号值的候选点可以被识别为属于同一个区域。优选地,所述方法还包括:针对二值化图像中的所有点,初始化类别标号。优选地,将由具有相同类别标号值、且该类别标号值与不在候选区域内的点的类别标号值不同的候选点组成的区域识别为一个封闭区域。优选地,扫描其相邻点的步骤还包括:如果所述相邻点的类别标号值不同,则将所述相邻点中的类别标号中最小的值分配给这些类别标号。优选地,对输入图像进行二值化的步骤包括:计算输入图像的每个像素点的多通道值的方差;如果方差大于阈值,则将该像素点在二值化图像中的值设置为1;否则设置为0。优选地,在进行二值化之后,还包括:对二值化图像进行去噪。优选地,对二值化图像进行去噪的步骤包括:根据已知的图像信息,对二值化图像进行去噪。根据本专利技术的另一方面,提出了一种封闭区域识别设备,包括:预处理单元,被配置为二值化包含一个或更多个封闭区域的输入图像,以获得二值化图像;候选区域确定单元,被配置为扫描二值化图像,针对每行和每列确定候选区域:行的起始点和结束点分别是该行的第一个前景点和最后一个前景点,列的起始点和结束点分别是该列的第一个前景点和最后一个前景点,在所述候选区域内的点被称为候选点;类别标号附加单元,被配置为依次扫描每个候选点,通过以下方式向每一个候选点附加类别标号:扫描其相邻点,如果在其相邻点中存在已被分配有类别标号的点,则将所述相邻点的类别标号中最小的值分配给该候选点的类别标号;如果其相邻点中不存在已被分配有类别标号的点,则使类别标号值递增1,并将该新的类别标号值分配给该候选点的类别标号;以及区域分类单元,被配置为将具有相同类别标号值的候选点识别为属于同一个区域。根据本专利技术的又一方面,提出了一种文档处理设备,包括:图像捕获系统,用于将文档转换为数字格式,以获得输入图像;以及封闭区域提取系统,用于对所述输入图像执行根据本专利技术实施例所述的封闭区域识别方法,以提取所述输入图像中的封闭区域。与现有技术不同,根据本专利技术实施例的封闭区域提取方法和设备在多个方面改善了封闭区域提取的性能,至少包括:1.即使封闭区域彼此相连,根据本专利技术实施例的封闭区域提取方法和设备仍然可以提取所有封闭区域,并且精确地识别每一点是在封闭区域内还是在封闭区域外。2.根据本专利技术实施例的封闭区域提取方法和设备与线的宽度和线的形状无关。包围感兴趣区域的线可以是曲线、直线或任意形状。同样,对于线的宽度也没有限制。线可以是粗线或者细线。3.根据本专利技术实施例的封闭区域提取方法和设备对于封闭区域的形状没有限制。可检测的封闭区域可以是凸行或凹形。可检测的封闭区域也可以非常大,或者非常小。附图说明通过下面结合附图说明本专利技术的优选实施例,将使本专利技术的上述及其它目的、特征和优点更加清楚,其中:图1是示出了根据本专利技术实施例的封闭区域提取系统的示意框图;图2示出了根据本专利技术实施例的封闭区域提取方法的流程图;图3示出了根据本专利技术实施例的二值化过程的流程图;图4示出了根据本专利技术实施例的类别标号设置过程的流程图;图5示出了标记有一些封闭区域的常见页面的示例;图6示出了图5所示的页面中要检测的范围;图7示出了根据本专利技术实施例的方法,针对图5所示的示例所获得的二值化图像;图8示出了对图5所示的示例执行根据本专利技术实施例的方法所检测到的封闭区域;以及图9示出了根据本专利技术实施例的封闭区域识别方法可应用于的文档处理设备的框图。具体实施方式以下参照附图,对本专利技术的示例实施例进行详细描述。在以下描述中,一些具体实施例仅用于描述目的,而不应该理解为对本专利技术有任何限制,而只是本专利技术的示例。在可能导致对本专利技术的理解造成混淆时,将省略常规结构或构造。本申请的专利技术人受到连通体标记方法(connected-compon本文档来自技高网
...

【技术保护点】
一种封闭区域识别方法,包括:对包含一个或更多个封闭区域的输入图像进行二值化,以获得二值化图像;扫描二值化图像,针对每行和每列确定候选区域:行的起始点和结束点分别是该行的第一个前景点和最后一个前景点,列的起始点和结束点分别是该列的第一个前景点和最后一个前景点,在所述候选区域内的点被称为候选点;依次扫描每个候选点,通过以下方式向每一个候选点附加类别标号:扫描其相邻点,如果在其相邻点中存在已被分配有类别标号的点,则将所述相邻点的类别标号中最小的值分配给该候选点的类别标号;如果其相邻点中不存在已被分配有类别标号的点,则使类别标号值递增1,并将该新的类别标号值分配给该候选点的类别标号;以及将具有相同类别标号值的候选点识别为属于同一个区域。

【技术特征摘要】
1.一种封闭区域识别方法,包括:
对包含一个或更多个封闭区域的输入图像进行二值化,以获得二
值化图像;
扫描二值化图像,针对每行和每列确定候选区域:行的起始点和
结束点分别是该行的第一个前景点和最后一个前景点,列的起始点和
结束点分别是该列的第一个前景点和最后一个前景点,在所述候选区
域内的点被称为候选点;
依次扫描每个候选点,通过以下方式向每一个候选点附加类别标
号:
扫描其相邻点,如果在其相邻点中存在已被分配有类别标号
的点,则将所述相邻点的类别标号中最小的值分配给该候选点的
类别标号;如果其相邻点中不存在已被分配有类别标号的点,则
使类别标号值递增1,并将该新的类别标号值分配给该候选点的
类别标号;以及
将具有相同类别标号值的候选点识别为属于同一个区域。
2.根据权利要求1所述的封闭区域识别方法,还包括:针对二值
化图像中的所有点,初始化类别标号。
3.根据权利要求1所述的封闭区域识别方法,其中,将由具有相
同类别标号值、且该类别标号值与不在候选区域内的点的类别标号值
不同的候选点组成的区域识别为一个封闭区域。
4.根据权利要求1所述的封闭区域识别方法,其中,扫描其相邻
点的步骤还包括:如果所述相邻点的类别标号值不同,则将所述相邻
点中的类别标号中最小的值分配给这些类别标号。
5.根据权利要求1所述的封闭区域识别方法,其中,对输入图像
进行二值化包括:
计算输入图像的每个像素点的多通道值的方差;
如果方差大于阈值,则将该像素点在二值化图像中的值设置为1;
否则设置为0。
6.根据权利要求1所述的封闭区域识别方法,在进行二值化之后,
还包括:
对二值化图像进行去噪。
7.根据权利要求6所述的封闭区域识别方法,其中,对二值化图
像进行去噪包括:
根据已知的图像信息,对二值化图像进行去噪。
8.一种封闭区域识别设备,包括:
预处理单元,被配置为二值化包含一个或更多个封闭区域的输入
图像,以获得二值化图像;
候选区域确定单元,被配置为扫描二值化图像,针对每行和每列
确定候选区域:行的起始点和结...

【专利技术属性】
技术研发人员:张庆久乐宁
申请(专利权)人:夏普株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1