一种在自然场景图像中基于连通域的中文检测方法技术

技术编号：8683108 阅读：220 留言：0更新日期：2013-05-09 03:03

本发明专利技术公开一种在自然场景图像中基于连通域的中文检测方法，该方法首先获取自然场景图像，将自然场景图像进行笔划宽度变换预处理；笔划宽度变换的输出是一个图像，该图像的每一个像素值代表原始图像相应位置的像素的最大可能笔划宽度，在这一步中进行图像像素的连通域标定；在获得连通分量之后，提取连通分量的各种特征，这些特征组合能很好的表达连通分量；从中文结构出发，首先执行字内合并，接着执行字间合并，字内合并方法检测单个的汉字，字间合并方法检测文本行，并用矩形框对文本区域加以标定。本发明专利技术方法以中文的复杂结构为出发点，在中文检测方面具有更好的针对性，因此具有更高的主动性和精确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种文本定位领域，具体地说，涉及的是ー种在自然场景图像中基于连通域的中文检测方法。
技术介绍
文本是计算机视觉的许多应用中的ー项重要特征。图像中的文本存有很多有用的信息，对视觉内容理解和获取至关重要。文本提取的主要目的是将文本图像转化为符号形式，从而利于修改、检索、利用及传输。文本定位是文本提取的ー个重要步骤。文本定位是对图像中文本位置的精确定位。基于连通域的文本定位方法首先将图像表示为ー个个的连通域，然后从结构分析出发，通过合并方法将文本行标示，输出結果。传统的合并方法在处理ー些结构复杂的汉字时效果不甚理想。外语如最常见的英语单词字符之间一般水平排列。对于中文文字，情况更加复杂。本专利技术提出的基于连通域的中文合并方法，效果很好。中国专利申请号为200710064388.1、公开号为101266654的专利技术专利，该专利技术公开基于连通分量和支持向量机的图像中文本定位的方法和装置。该专利技术的主要创新是利用支持向量机的学习方法来提高字符连通分量判决的准确性。但因为中文字数很多，该方法需要大量标注的正负样本来学习，工作量较大，而且并没有显示对结构复杂的文字连通域合并有效的解决方法。
技术实现思路
本专利技术的目的在于针对目前图像文本定位上的定位不甚理想的情况，提出ー种基于连通域的中文检测方法，该方法抓住文字笔画宽度一致的特征，利用Canny和梯度信息提取笔画宽度，形态学获取连通区域，并利用文字的结构信息来进行连通区域的合并，提高对上中下、左中右等复杂结构的汉字的检测，同时实现文字区域定位和分割，方法简单有效。这种方法以中文的复杂结构为出发点，...

【技术保护点】
一种在自然场景图像中基于连通域的中文检测方法，其特征在于包括以下具体步骤：第一步，进行输入图像处理，首先获取自然场景图像，将自然场景图像进行笔划宽度变换预处理；第二步，笔划宽度变换的输出是一个图像，该图像的每一个像素值代表原始图像相应位置的像素的最大可能笔划宽度，在这一步中进行图像像素的连通域标定；第三步，在获得连通分量之后，提取连通分量的各种特征，这些特征组合能很好的表达连通分量；第四步，得到连通分量的各种特征之后，从中文结构出发，首先执行字内合并，接着执行字间合并，字内合并方法检测单个的汉字，字间合并方法检测文本行，并用矩形框对文本区域加以标定。

【技术特征摘要】
1.一种在自然场景图像中基于连通域的中文检测方法，其特征在于包括以下具体步骤: 第一歩，进行输入图像处理，首先获取自然场景图像，将自然场景图像进行笔划宽度变换预处理；第二歩，笔划宽度变换的输出是ー个图像，该图像的每ー个像素值代表原始图像相应位置的像素的最大可能笔划宽度，在这ー步中进行图像像素的连通域标定；第三步，在获得连通分量之后，提取连通分量的各种特征，这些特征组合能很好的表达连通分量；第四步，得到连通分量的各种特征之后，从中文结构出发，首先执行字内合并，接着执行字间合井，字内合并方法检测单个的汉字，字间合并方法检测文本行，并用矩形框对文本区域加以标定。2.根据权利要求1所述的在自然场景图像中基于连通域的中文检测方法，其特征在于第一步所述的笔划宽度变换，具体过程如下: (1)在进行笔划宽度变换之前，首先将彩色图转化为灰度图，并进行ニ值化处理； (2)利用Canny边缘检测算子提取图像存在的边缘信息； (3)获取(2)中边缘像素的梯度方向，梯度方向的获取用原始图像和Sobel算子作卷积得到； (4)笔划宽度赋值，将梯度方向相反的边缘像素对之间的像素赋值，大小为该像素对之间的距离； (5)形态学滤波:采用膨胀再腐蚀的运算来连接邻近的区域，再用腐蚀的方法去除ー些直线。3.根据权利要求1所述的在自然场景图像中基于连通域的中文检测方法，其特征在于第二步中，所述图像像素的连通域标定利用修改后顺序区域标定方法，具体过程如下: (1)如果相邻两个像素值比值在区间1/3和3之间，则认为其“相邻”，图像由左至右下进行遍历并顺序地在标记图上相应像素赋以标记； (2)标记传递:如果当前的像素是ー个前景像素，则将被赋予ー个新的区域标号，或者如果该邻域中之前检查过的邻近节点是ー个前景像素，则该像素的标号与...

【专利技术属性】
技术研发人员：周异，陈凯，徐奕，徐勇，陈庆明，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人