一种定位自然场景图像中文本的方法技术

技术编号：7759558 阅读：281 留言：0更新日期：2012-09-14 02:03

本发明专利技术提出了一种定位自然场景图像中文本的方法，包括：图像连通域提取步骤，提取最稳定极值区域作为图像连通域；文本块提取步骤，针对图像连通域建立无向图模型并使用并查集提取无向图的连通域作为文本块；文本块判别步骤，提取文本块特征并使用机器学习算法进行文本块分类。根据本发明专利技术，能够快速准确地定位自然场景图像中的文本，得到的查全率和查准率高于目前现有技术中的方法。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像文本分析领域，具体涉及ー种定位自然场景图像中文本的方法。
技术介绍
以往的定位自然场景图像中文本的方法大致可以归为两类基于文本块的和基于图像连通域的。基于文本块的方法使用滑动窗ロ在图像中捜索可能的文本块，然后使用机器学习的算法进行文本块判定。基于图像连通域的方法首先通过某些方法提取图像中的连通域，然后将连通域聚合成文本块，并通过进一歩的检查或使用机器学习算法进行文本块的判定。在非专利文献I中，通过聚合具有相似笔划宽度的像素点形成连通域，得到的连通域经过过滤后聚合成文本。非专利文献2是ー种基于文本块的方法，使用了文本块的水平和垂直梯度变化率的方差特征。非专利文献3中提到ー种基于连通域的方法。该方法使用最稳定极值区域作为连通域，连通域聚合成文本块后提取文本块的梯度特征，并使用级联的分类器对文本块进行判定。在目前已有的方法中，文本的查全率和查全率较低，处理速度较慢。非专利文献I :B. Epshtein, E. Ofek, and Y. ffexler. Detecting text innatural scenes with stroke width transform. Computer Vision and PatternRecognition (CVPR)，2010 IEEE Conference on，pages 2963-2970，June 2010非专利文献2:Χ· Chen and A. Yuille. Detecting and reading text in naturalscenes.In Computer Visio...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：殷绪成，尹绪旺，郝红卫，
申请(专利权)人：北京科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人