封闭区域识别方法和设备技术

技术编号：11604475 阅读：96 留言：0更新日期：2015-06-17 01:54

本发明专利技术涉及封闭区域识别方法和设备，用于精确地识别文档中的封闭区域。该方法包括对包含封闭区域的输入图像进行二值化，以获得二值化图像；扫描二值化图像以确定候选区域；依次扫描候选区域内的每个点，通过以下方式向每一个点附加类别标号：扫描其相邻点，如果在其相邻点中存在已被分配有类别标号的点，则将所述相邻点的类别标号中最小的值分配给该点的类别标号；如果其相邻点中不存在已被分配有类别标号的点，则使类别标号值递增1，并将该新的类别标号值分配给该点的类别标号；以及将具有相同类别标号值的点识别为属于同一个区域。即使封闭区域彼此相连，根据本发明专利技术的方法仍然可以提取所有封闭区域，并且与对区域进行标记的线的形状和宽度无关。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理技术，更具体地，涉及封闭区域识别方法和设备。
技术介绍
人们通常在阅读文档时对感兴趣的内容进行标记。因此，提出了一些方法，以提取文档中所标记区域。但是，一些方法无法精确地分离多个连通的区域。一些方法可以提取多个区域，但是当这些区域彼此连通时，无法精确地提取这些区域。其他一些方法基于图形方法来提取连通的封闭区域，但是这些方法也无法精确地提取封闭区域。还提出了一些方法，这些方法为了提取封闭区域可能需要知晓所标记区域的形状。一些提取方法仅适用于特定形状的区域。例如，一些方法仅能够提取矩形形状的区域。显然，这种限制对于用户而言不方便。近年来提出了一些方法，其假定所标记区域是通过直线构成的。但是，很难以确保用户所描绘的线是直线。这也限制了这些方法的应用。题为“User-enclosed Region Extraction From Scanned Document Images(从扫描文档图像中提取用户封闭区域)”的美国专利US6,351,559提出了一种从扫描文档图像中提取用户描绘的封闭区域的设备。其中，连通体分析器以位图格式分析文档，从而使得该设备能够检测可能存在的用户封闭区域，而无论文档图像的内容是什么。双向连通体模块使得用户可以用具有任何形状的标记来包围一个区域。用户所描绘的区域可以横跨文档页面上的文本行或图像。检测分析过滤器使用多个探索器来消除与用户所...

【技术保护点】
一种封闭区域识别方法，包括：对包含一个或更多个封闭区域的输入图像进行二值化，以获得二值化图像；扫描二值化图像，针对每行和每列确定候选区域：行的起始点和结束点分别是该行的第一个前景点和最后一个前景点，列的起始点和结束点分别是该列的第一个前景点和最后一个前景点，在所述候选区域内的点被称为候选点；依次扫描每个候选点，通过以下方式向每一个候选点附加类别标号：扫描其相邻点，如果在其相邻点中存在已被分配有类别标号的点，则将所述相邻点的类别标号中最小的值分配给该候选点的类别标号；如果其相邻点中不存在已被分配有类别标号的点，则使类别标号值递增1，并将该新的类别标号值分配给该候选点的类别标号；以及将具有相同类别标号值的候选点识别为属于同一个区域。

【技术特征摘要】
1.一种封闭区域识别方法，包括：
对包含一个或更多个封闭区域的输入图像进行二值化，以获得二
值化图像；
扫描二值化图像，针对每行和每列确定候选区域：行的起始点和
结束点分别是该行的第一个前景点和最后一个前景点，列的起始点和
结束点分别是该列的第一个前景点和最后一个前景点，在所述候选区
域内的点被称为候选点；
依次扫描每个候选点，通过以下方式向每一个候选点附加类别标
号：
扫描其相邻点，如果在其相邻点中存在已被分配有类别标号
的点，则将所述相邻点的类别标号中最小的值分配给该候选点的
类别标号；如果其相邻点中不存在已被分配有类别标号的点，则
使类别标号值递增1，并将该新的类别标号值分配给该候选点的
类别标号；以及
将具有相同类别标号值的候选点识别为属于同一个区域。
2.根据权利要求1所述的封闭区域识别方法，还包括：针对二值
化图像中的所有点，初始化类别标号。
3.根据权利要求1所述的封闭区域识别方法，其中，将由具有相
同类别标号值、且该类别标号值与不在候选区域内的点的类别标号值
不同的候选点组成的区域识别为一个封闭区域。
4.根据权利要求1所述的封闭区域识别方法，其中，扫描其相邻
点的步骤还包括：如果所述相邻点的类别标号值不同，则将所述相邻
点中的类别标号中最小的值分配给这些类别标号。
5.根据权利要求1所述的封闭区域识别方法，其中，对输入图像
进行二值化包括：
计算输入图像的每个像素点的多通道值的方差；
如果方差大于阈值，则将该像素点在二值化图像中的值设置为1；
否则设置为0。
6.根据权利要求1所述的封闭区域识别方法，在进行二值化之后，
还包括：
对二值化图像进行去噪。
7.根据权利要求6所述的封闭区域识别方法，其中，对二值化图
像进行去噪包括：
根据已知的图像信息，对二值化图像进行去噪。
8.一种封闭区域识别设备，包括：
预处理单元，被配置为二值化包含一个或更多个封闭区域的输入
图像，以获得二值化图像；
候选区域确定单元，被配置为扫描二值化图像，针对每行和每列
确定候选区域：行的起始点和结...

【专利技术属性】
技术研发人员：张庆久，乐宁，
申请(专利权)人：夏普株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人