基于连通分量和支持向量机的图像文本定位方法和装置制造方法及图纸

技术编号：2925720 阅读：253 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开基于连通分量和支持向量机的图像中文本定位的方法和装置，图像分割单元，连通域分析单元；连通分量特征获取和阈值确认单元，支持向量机分类单元，连通分量组合成文本区域单元，文本区域统计特征获取并确认单元；方法将输入图像分割得到图像分层结果，用连通域分析对前景层进行分析得到连通分量的集合；提取出连通分量特征，通过使用级联阈值分类器的结构排除大量的非字符连通分量，对剩下的候选字符连通分量再运用支持向量机分类方法进行识别是否是字符连通分量；对剩余的连通分量根据特征一致和距离相近原则组合成候选文本区域，并提取出这些候选文本区域的特征，对这些特征用经验性的阈值确认是否为文本区域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉的光学字符识别(OCR)的预处理领域，涉及一种基于连通分量和支持向量机的真实场景图像或视频序列图像中文本的定位方法和装置，用于智能数字图像分析和理解。
技术介绍
数字图像或视频帧中的文本拥有大量的语义信息，比如路标，广告，指示标语等。因此一个鲁棒的针对复杂背景图像中的文本定位方法，并联合文宇识别会带来各种实际的运用，例如基于内容的视频索引和图像的检索，汽车辅助驾驶，移动机器人的视觉导航等应用。将该方法加上一个机器翻译系统有助于国际游客克服语言上的障碍。然而由于在复杂背景图像中文本定位上的困难，传统的针对扫描得到的文档图像的光学字符识别很难直接运用到针对一般图像中的字符识别。为了能够识别嵌入在复杂图像中的文字，首先需要能够很好的定位复杂图像中的字符区域的准确边框，才能很好利用已有的光学字符识别技术。近年来，已有很多研究机构开展了这方面的研究工作，提出了一些方法，而且取得了一定的效果，参考，ZhongY.,KaryK.，JainA.K.的论文(题目"Locating text in complex color image...

【技术保护点】
一种基于连通分量和支持向量机的图像文本定位置方法，其特征在于，步骤如下：步骤Ｓ１：将需要定位的图像根据其灰度值信息进行图像的分割处理，获得图像分层结果；步骤Ｓ２：对分割后的每一层作为前景进行连通域分析，得到候选字符连通分量集合；步骤Ｓ３：提取候选字符连通分量的特征，并用一个级联阈值分类器的结构排除非字符连通分量；每个阈值分类器的阈值通过统计样本数据获得；步骤Ｓ４：对使用级联阈值分类器未被排除的候选字符连通分量，采用基于支持向量机的分类方法进行是否是字符连通分量的分类，支持向量机的特征向量为上述获取的所有字符连通分量特征；步骤Ｓ５：...

【技术特征摘要】

【专利技术属性】
技术研发人员：姚金良，杨一平，台宪青，薛文芳，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人