一种在自然场景图像中基于连通域的中文检测方法技术

技术编号:8683108 阅读:220 留言:0更新日期:2013-05-09 03:03
本发明专利技术公开一种在自然场景图像中基于连通域的中文检测方法,该方法首先获取自然场景图像,将自然场景图像进行笔划宽度变换预处理;笔划宽度变换的输出是一个图像,该图像的每一个像素值代表原始图像相应位置的像素的最大可能笔划宽度,在这一步中进行图像像素的连通域标定;在获得连通分量之后,提取连通分量的各种特征,这些特征组合能很好的表达连通分量;从中文结构出发,首先执行字内合并,接着执行字间合并,字内合并方法检测单个的汉字,字间合并方法检测文本行,并用矩形框对文本区域加以标定。本发明专利技术方法以中文的复杂结构为出发点,在中文检测方面具有更好的针对性,因此具有更高的主动性和精确性。

【技术实现步骤摘要】

本专利技术涉及一种文本定位领域,具体地说,涉及的是ー种在自然场景图像中基于连通域的中文检测方法
技术介绍
文本是计算机视觉的许多应用中的ー项重要特征。图像中的文本存有很多有用的信息,对视觉内容理解和获取至关重要。文本提取的主要目的是将文本图像转化为符号形式,从而利于修改、检索、利用及传输。文本定位是文本提取的ー个重要步骤。文本定位是对图像中文本位置的精确定位。基于连通域的文本定位方法首先将图像表示为ー个个的连通域,然后从结构分析出发,通过合并方法将文本行标示,输出結果。传统的合并方法在处理ー些结构复杂的汉字时效果不甚理想。外语如最常见的英语单词字符之间一般水平排列。对于中文文字,情况更加复杂。本专利技术提出的基于连通域的中文合并方法,效果很好。中国专利申请号为200710064388.1、公开号为101266654的专利技术专利,该专利技术公开基于连通分量和支持向量机的图像中文本定位的方法和装置。该专利技术的主要创新是利用支持向量机的学习方法来提高字符连通分量判决的准确性。但因为中文字数很多,该方法需要大量标注的正负样本来学习,工作量较大,而且并没有显示对结构复杂的文字连通域合并有效的解决方法。
技术实现思路
本专利技术的目的在于针对目前图像文本定位上的定位不甚理想的情况,提出ー种基于连通域的中文检测方法,该方法抓住文字笔画宽度一致的特征,利用Canny和梯度信息提取笔画宽度,形态学获取连通区域,并利用文字的结构信息来进行连通区域的合并,提高对上中下、左中右等复杂结构的汉字的检测,同时实现文字区域定位和分割,方法简单有效。这种方法以中文的复杂结构为出发点,在中文检测方面具有更好的针对性,因此具有更高的主动性和精确性。为实现上述目的,本专利技术所述的基于连通域的中文检测的方法,包括以下步骤:第一歩,进行输入图像处理,首先获取自然场景图像,将自然场景图像进行笔划宽度变换等预处理。第二歩,笔划宽度变换的输出是ー个图像,该图像的每ー个像素值代表原始图像相应位置的像素的最大可能笔划宽度。在这ー步中将进行图像像素的连通域标定。第三步,在获得连通分量之后,提取连通分量的各种特征,这些特征组合必须能够很好的表达连通分量。第四步,得到连通分量的各种特征之后,从中文结构出发,首先执行字内合并,接着执行字间合并,字内合并方法检测单个的汉字,字间合并方法检测文本行,并用矩形框对文本区域加以标定。上述第一歩中,需要对原始图像进行笔画宽度变换,具体过程如下:( I)在进行笔划宽度变换之前,首先将彩色图转化为灰度图,并进行ニ值化处理;(2)利用Canny边缘检测算子提取图像存在的边缘信息。(3)获取(2)中边缘像素的梯度方向,梯度方向的获取用原始图像和Sobel算子作卷积得到;(4)笔划宽度赋值,将梯度方向相反的边缘像素对之间的像素赋值,大小为该像素对之间的距离;(5)形态学滤波:采用膨胀再腐蚀的运算来连接邻近的区域,再用腐蚀的方法去除一些直线。上述第二步中,如图3所示,利用修改后顺序区域标定方法进行连通域标定,具体过程如下:(I)考察邻近像素“相邻”关系,如果相邻两个像素值比值在区间1/3和3之间,则认为其“相邻”,图像由左至右下进行遍历并顺序地在标记图上相应像素赋以标记;(2)标记传递:如果当前的像素是ー个前景像素,则将被赋予ー个新的区域标号,或者如果该邻域中之前检查过的邻近节点是ー个前景像素,则该像素的标号与其邻近节点的标号一致;(3)解决标号冲突:一旦所有属于同一区域的不同标记被确定下来,该区域中所有像素的标记安然无恙被更新为同一个值。(4)结束标定,输出结果;上述第三步中,利用获得的连通域(值大小相同的像素属于同一个连通域),提取连通域的各种特征,具体特征如下:(I)字符笔划宽度方差与背景的对比度;(2)字符的长宽比;( 3 )笔划宽度和连通域尺寸比值;( 4 )连通域尺寸和连通域面积比值。上述第四步中,利用步骤3得到的连通域特征,顺序执行字内合并方法和字间合并方法,具体过程如下:( I)字内合并方法合并条件:每ー个连通域被认为是ー个可能的“简单”的汉字。通常一个汉字包含至少两个“简单”的汉字。如果两个“简单”的汉字相邻并且满足定义的限制条件,执行字内合并方法,将两个“简単”的汉字是否合并为ー个汉字。所述限制条件如下:I)两个连通域的平均笔划宽度比值必须在1/2和2之间。2)两个汉字的连通域外接矩形的中心点X坐标差值不大于平均笔划宽度的3.5倍,I坐标差值不大于平均笔划宽度的7倍。3)两个汉字的连通域外接矩形的中心点I坐标差值不大于平均笔划宽度的3.5倍,X坐标差值不大于平均笔划宽度的7倍。(2)字间合并方法合并条件:I)属于ー个文本行里的汉字的平均笔划宽度比值应该在0.8和1.25之间。2)两个汉字的连通域外接矩形的中心点X坐标差值不大于两个连通域之间最高的高度值的0.5倍。3)两个汉字的连通域外接矩形的中心点I坐标差值不大于两个连通域之间最宽的宽度值的3倍。(3)首先执行字内合并,过程如下:I)遍历所有连通域,如果两个连通域满足字内合并条件,合并,形成一个连通域对;2)遍历所有连通域对,如果两个连通域对共有一个连通域,各并成ー个新的连通域组,去除原来的连通域对。3)将2)中得到的连通域组更新位新的连通域。(4)执行字间合并,各并条件如(2)所示,合并过程与字内合并相同。(5)得到字间合并的连通域,以矩形框限定输出。与现有技术相比,本专利技术具有如下的有益效果:本专利技术与传统的中文检测方法有所区别,利用笔划宽度变换得到可能的宽度信息,然后利用修改的顺序区域标定方法将连通域标示,再利用中文合并方法检测图像中的中文文本。传统的合并方法在处理ー些结构复杂的汉字时效果不甚理想,比如最常见的英语单词字符之间一般水平排列,而对于中文文字,情况则非常复杂。一个汉字可能由更多的部首组成,位置关系不仅有左中右水平排列,还有上中下垂直排列,本专利技术的合并方法在处理复杂中文字合并时具有更高的准确性。综上,本专利技术基于连通域的中文检测方法相比于传统的文本检测等方法,拥有更高的主动性和精确性。附图说明通过阅读參照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1是本专利技术的流程图。图2是本专利技术一实施例笔画宽度变换的流程图。图3是本专利技术一实施例修改后的顺序区域标定的流程图。图4是本专利技术一实施例中文合并方法的效果图,其中:(a)寻找相邻的连通域。(b)字间合并算过程及結果。(C)两个相邻的汉字合并成ー个文本行,找到两个文本行和ー个汉字。具体实施例方式下面结合具体实施例对本专利技术进行详细说明。以下实施例将有助于本领域的技术人员进一歩理解本专利技术,但不以任何形式限制本专利技术。应当指出的是,对本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变形和改进。这些都属于本专利技术的保护范围。如图1所示,本实施例提供一种基于连通域的中文检测方法,流程可以分为以下几个步骤:步骤1:得到输入图像,执行预处理;步骤2:对图像进行连通域标定;步骤3:针对每一个连通域,提取连通域特征信息;步骤4:根据得到的连通域特征信息,将连通域合并,执行字内合并过程;步骤5:执行字间合并过程;步骤6:得到检测出的中文文本行,检测结束。步骤I的过程如图2所示,需要注意本文档来自技高网...

【技术保护点】
一种在自然场景图像中基于连通域的中文检测方法,其特征在于包括以下具体步骤:第一步,进行输入图像处理,首先获取自然场景图像,将自然场景图像进行笔划宽度变换预处理;第二步,笔划宽度变换的输出是一个图像,该图像的每一个像素值代表原始图像相应位置的像素的最大可能笔划宽度,在这一步中进行图像像素的连通域标定;第三步,在获得连通分量之后,提取连通分量的各种特征,这些特征组合能很好的表达连通分量;第四步,得到连通分量的各种特征之后,从中文结构出发,首先执行字内合并,接着执行字间合并,字内合并方法检测单个的汉字,字间合并方法检测文本行,并用矩形框对文本区域加以标定。

【技术特征摘要】
1.一种在自然场景图像中基于连通域的中文检测方法,其特征在于包括以下具体步骤: 第一歩,进行输入图像处理,首先获取自然场景图像,将自然场景图像进行笔划宽度变换预处理; 第二歩,笔划宽度变换的输出是ー个图像,该图像的每ー个像素值代表原始图像相应位置的像素的最大 可能笔划宽度,在这ー步中进行图像像素的连通域标定; 第三步,在获得连通分量之后,提取连通分量的各种特征,这些特征组合能很好的表达连通分量; 第四步,得到连通分量的各种特征之后,从中文结构出发,首先执行字内合并,接着执行字间合井,字内合并方法检测单个的汉字,字间合并方法检测文本行,并用矩形框对文本区域加以标定。2.根据权利要求1所述的在自然场景图像中基于连通域的中文检测方法,其特征在于第一步所述的笔划宽度变换,具体过程如下: (1)在进行笔划宽度变换之前,首先将彩色图转化为灰度图,并进行ニ值化处理; (2)利用Canny边缘检测算子提取图像存在的边缘信息; (3)获取(2)中边缘像素的梯度方向,梯度方向的获取用原始图像和Sobel算子作卷积得到; (4)笔划宽度赋值,将梯度方向相反的边缘像素对之间的像素赋值,大小为该像素对之间的距离; (5)形态学滤波:采用膨胀再腐蚀的运算来连接邻近的区域,再用腐蚀的方法去除ー些直线。3.根据权利要求1所述的在自然场景图像中基于连通域的中文检测方法,其特征在于第二步中,所述图像像素的连通域标定利用修改后顺序区域标定方法,具体过程如下: (1)如果相邻两个像素值比值在区间1/3和3之间,则认为其“相邻”,图像由左至右下进行遍历并顺序地在标记图上相应像素赋以标记; (2)标记传递:如果当前的像素是ー个前景像素,则将被赋予ー个新的区域标号,或者如果该邻域中之前检查过的邻近节点是ー个前景像素,则该像素的标号与...

【专利技术属性】
技术研发人员:周异陈凯徐奕徐勇陈庆明
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1