一种基于外包络生长的图标检测方法及其应用技术

技术编号:4325310 阅读:267 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种基于外包络生长的图标检测方法,包括下述步骤:(1)在整幅由像素组成图像中,将某些人为选定的可能属于一个图标的像素设为种子点,搜索图像中的像素,搜索到N(N≥1)个种子点后,在其外侧设置初始外包络;初始外包络包含该N个种子点在内,准备进行生长;(2)对外包络的生长,设定基本终止条件;(3)从初始外包络出发,将初始外包络逐次生长为符合步骤(2)中终止条件的外包络。本方法较好地利用了图像的布局规则,在定位过程中只需检验一定数量的像素,远远快于连通域算法;另外,不需借助任何模糊或者膨胀运算,进一步提高了运算速度;还可避免出现图标与其他部分粘连的问题,所以检测精确度高,适用性良好。

【技术实现步骤摘要】

本专利技术涉及图像检测技术,特别涉及一种基于外包络生长的图标检测 方法及其应用。
技术介绍
在文本图像、网页图像的处理中,图标的检测是一种重要的辅助 手段。通过检测并识别在文本中出现的图标,可以迅速确定文本的发 行机构或网页的所属者,为对文本或网页内容的进一步分析提供重要 的依据,从而极大地提高文本或网页的处理效率。现有的图标检领!J处理技术有Automatic Document Logo Detection (文本图*示的自动检测),来源Proceedings of the Ninth International Conference on Document Analysis and Recognition (ICDAR 2007),这禾中方法的主要原理是(1)如图1所示,将图像模糊化(即降低图像 分辨率),这样由于在图标内部各部分距离相对较近,会粘连成一个 整体。(2)对模糊图像,采取连通域方法对每一个粘连起来的整体进 行提取,提取出来的每一个整体认为有可能是图标,送数据库鉴别。 这种方法的主要缺点是(1)图像模糊化后文本图像中的图标容易与 文本图像中的其他成分相连,如图2、图3所示,在空间比较拥挤时, 模糊化的结果不仅图标内部会粘连起来,图标与图标外部也会粘连起 来。(2)连通域算法速度较慢。另一份文献Logo detection in document images(文本图像的图标检测),来源Proc. Infl Conf. Imaging Science, Sys., and Tech., pages 446-449, 1997;这种方法的主要原理是(1)使 用文本分析的X-Y树方法将整幅文本图形进行分割。X-Y方法的过 程是将整幅图像在横轴或者纵轴上做投影,以判断是否可以在横轴或 纵轴上分割成两部分,如果可以,再将分割所得两部分各自重复该过 程。(2)将X-Y方法所分割成的每一最小部分送数据库鉴别。这种 方法存在的不足是并非所有文本中的Logo都可以与其他成分X-Y可分,如图4所示,这张支票的手写字符与印刷体字符存在粘连,造 成无法从横轴和纵轴的任一方向将支票内容分割。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供一种运算速度 快,检测精确度高,适用性良好的基于外包络生长的图标检测方法。本专利技术的另一目的在于提供上述基于外包络生长的图标检测方法的 应用。本专利技术的目的通过下述技术方案实现 一种基于外包络生长的图标检 测方法,包括下述步骤(1) 在整幅由像素组成图像中,将某些人为选定的可能属于一个图 标的像素(例如,如果一幅图像是二值图像,则认为该二值图像的前景像 素可能属于一个图标;如果一幅图像是彩色图像,则可认为某种颜色的像 素可能属于一个图标;如果己知一幅文本图像的用途,则可预先确定图标可能的位置,这样只有在这些特定位置的像素才有可能属于一个图标)设为种子点,搜索图像中的像素,搜索到N (N^l)个种子点后,在N个种 子点的外侧设置特定形状的初始外包络;所述初始外包络包含该N个种子 点在内,准备进行生长;(2) 对外包络的生长,设定基本终止条件某一空间区域范围内覆 盖的不同种类的像素(例如,在二值图像中的前景和背景像素、灰度图像 中的不同灰度值的像素,彩色图像中不同颜色的像素等)分布情况满足预 定要求;(3)从初始外包络出发,将初始外包络逐次生长为符合步骤(2) 中终止条件的外包络;具体为外包络的每次生长,先对外包络用步骤(2) 的终止条件进行判断,如果还需要继续生长,则将外包络在特定方向上进 行延伸,直至满足步骤(2)中的终止条件。—步骤(1)中,所述初始外包络的特定形状可为规则或不规则的几何 形状,优选矩形、圆形。步骤(1)中,搜索图像中的像素具体可为对所有像素进行逐行逐 列搜索,对于图标局限在特定空间区域内的图像,在一定范围内进行逐行 逐列搜索。步骤(2)中,所述预定要求可为(2-1)在二值图像中,矩形外包 络的边缘上不能存在前景像素;(2-2)圆形外包络离边缘距离一定范围内5的前景像素和背景像素个数的比例在某阈值Nmax以下;(2-3)在灰度图像中,矩形(圆形、或其他形状)外包络边缘附近一定范围内的像素灰度 值大于某值Gmax的像素个数在某阈值Nmax以下;(2-4)在彩色图像中,外包络边缘上不能存在某种颜色的像素等。歩骤(2)中,在满足该基本终止条件的基础上,也可以根据实际需 要附加其他的特定条件,例如一定大小的外包络、不包含某像素的外包络、 特定位置的外包络等。歩骤(3)中,所述将外包络在特定方向上进行延伸具体可为对于 二值图像的矩形外包络情况,预设循环的终止条件是四条边界均只有背景 像素,特定方向对应的是存在前景像素的边缘(如果矩形上边缘存在前景 像素,则上边缘上移1个单位,矩形左边缘存在前景像素,则左边缘左移 l个单位);对于彩色图像的圆形外包络情况,设定的循环终止条件是距离 圆形边缘n (n)l)个像素范围内的部分不能包含红色的像素超过10%, 那么可设定特定方向是圆形外包络的圆心不变,而半径延伸l个像素等。上述基于外包络生长的图标检测方法可应用于对文本图像、网页图 像的处理过程。本专利技术的作用原理是:基于小范围内的像素成分的分析进行的形状 快速刷新,利用特定类型图像排版布局的规则,确定意义单位(所述 意义单位是指在图像中空间位置集中的某些点的集合,这些点合在一 起组成的图案传递一条完整的信息,例如一个图标, 一个文本块、一 个表格等)所占据的特定形状,从而实现文本图像图标的检测识别。本专利技术相对于现有技术具有如下的优点及效果(1) 本专利技术方法较好地利用了图像的布局规则,在定位过程中只需检 验一定数量的像素,速度高于连通域算法50%以上;另外,不需借助任何 模糊或者膨胀运算,进一步提高了运算速度。(2) 本专利技术方法不需借助任何模糊或者膨胀运算,避免了可能出现的 图标与其他部分粘连的问题,所以检测精确度高,可用于各种不同情况的 图像图标检测,适用性良好。(3) 本专利技术方法降低了图标的成功检测对图标形状的依赖。例如图 13(a)是一个各连通域之间距离较大的图标,即使做模糊运算也不一定能 够将其各部分合并成一个连通域。但本专利技术提供的方法,即使以下方的五 角星作为种子点不能将整个图标提取出来(如图13(b)所示),以最上方的五角星为种子点仍然可能将整个图标提取出来(如图13(c)所示)。附图说明图1是现有技术中对图标进行模糊化处理的过程示意图;其中由(a) (c)逐渐模糊。图2是空间比较拥挤的文本图像的示例图;其中框内为图标。 图3是将图2模糊化处理后图标与文字发生粘连的示意图。 图4是一张无法用X-Y方法分析的文本图像的示例图。 图5是运用本专利技术方法对图1 (a)所示的图fe进行处理,种子点的外 包络延伸至包含整个图标的过程示意图;其中图5 (a)与图1 (a)相同。 图6是本实施例中二值图像矩形外包络生长的算法流程图。 图7本专利技术另一实施例的待处理二值文本图像。 图8是本实施例中二值图像圆形外包络生长的算法流程图。 图9是对图7所示文本图像的图标设置初始圆形外包络的示意图。 图10是对图7所示文本图像的图标处理完成的示意图。 图11是本专利技术又一实施例的待本文档来自技高网
...

【技术保护点】
一种基于外包络生长的图标检测方法,其特征在于包括下述步骤: (1)在整幅由像素组成图像中,将某些人为选定的可能属于一个图标的像素设为种子点,搜索图像中的像素,搜索到N(N≥1)个种子点后,在N个种子点的外侧设置特定形状的初始外包络;所 述初始外包络包含该N个种子点在内,准备进行生长; (2)对外包络的生长,设定基本终止条件:某一空间区域范围内覆盖的不同种类的像素分布情况满足预定要求; (3)从初始外包络出发,将初始外包络逐次生长为符合步骤(2)中终止条件的外包 络;具体为:外包络的每次生长,先对外包络用步骤(2)的终止条件进行判断,如果还需要继续生长,则将外包络在特定方向上进行延伸,直至满足步骤(2)中的终止条件。

【技术特征摘要】
1、一种基于外包络生长的图标检测方法,其特征在于包括下述步骤(1)在整幅由像素组成图像中,将某些人为选定的可能属于一个图标的像素设为种子点,搜索图像中的像素,搜索到N(N≥1)个种子点后,在N个种子点的外侧设置特定形状的初始外包络;所述初始外包络包含该N个种子点在内,准备进行生长;(2)对外包络的生长,设定基本终止条件某一空间区域范围内覆盖的不同种类的像素分布情况满足预定要求;(3)从初始外包络出发,将初始外包络逐次生长为符合步骤(2)中终止条件的外包络;具体为外包络的每次生长,先对外包络用步骤(2)的终止条件进行判断,如果还需要继续生长,则将外包络在特定方向上进行延伸,直至满足步骤(2)中的终止条件。2、 根据权利要求1所述的基于外包络生长的图标检测方法,其特征 在于步骤(1)中,所述初始外包络的特定形状为规则或不规则的几何 形状。3、 根据权利要求2所述的基于外包络生长的图标检测方法,其特征 在于所述初始外包络的特定形状为矩形或圆形。4、 根据权利要求1所述的基于外包络生长的图标检测方法,其特征 在于歩骤(1)中,搜索图像中的像素具体为对所有像素进行逐行逐 列搜索,对于图标局限在特定空间区域内的图像,在一定范围内进行逐行 逐列搜索。5、 根据权利要求1所述的基于外包络生长的图标检测方法,其特征 在于步骤(2)中,所述预定要求为(2-1)在...

【专利技术属性】
技术研发人员:陈友斌王宏业
申请(专利权)人:东莞市微模式软件有限公司
类型:发明
国别省市:44[中国|广东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1