本发明专利技术公开了一种复杂背景图像中的文本定位方法。本方法为:1)在待处理的彩色图像的R、G和B三个通道上分别使用MSERs算法进行处理,得到对应三个通道上的MSERs区域;然后将得到的结果标记在该彩色图像上,得到每个MSERs区域在彩色图像上的坐标;2)进行初步去噪,去掉判断为重复的MSERs区域和非文本的MSERs区域,得到候选MSERs区域;3)从得到的候选MSERs区域中提取设定特征,然后利用一基于该设定特征训练的分类器对候选MSERs区域分类,得到包含文本的MSERs区域,即文本块;4)将得到的文本块连接成文本条;5)对得到的文本条进行去重处理。本发明专利技术大大提高了文本定位效率。
【技术实现步骤摘要】
【专利摘要】本专利技术公开了。本方法为:1)在待处理的彩色图像的R、G和B三个通道上分别使用MSERs算法进行处理,得到对应三个通道上的MSERs区域;然后将得到的结果标记在该彩色图像上,得到每个MSERs区域在彩色图像上的坐标;2)进行初步去噪,去掉判断为重复的MSERs区域和非文本的MSERs区域,得到候选MSERs区域;3)从得到的候选MSERs区域中提取设定特征,然后利用一基于该设定特征训练的分类器对候选MSERs区域分类,得到包含文本的MSERs区域,即文本块;4)将得到的文本块连接成文本条;5)对得到的文本条进行去重处理。本专利技术大大提高了文本定位效率。【专利说明】-种复杂背景图像中的文本定位方法
本专利技术属于图像处理的范畴,是一种基于MSERs复杂背景图像中的文本定位方法。
技术介绍
图片中的文本往往包含有价值的信息,并且在很多基于内容的图片和图像应用中 被开发,像基于内容的网络图片查找,图像信息检索,和自动文本分析和识别。由于背景,文 本方向、颜色、大小,字体的复杂性,在文本被识别和检索前需要鲁棒地检测到。许多研究者 把光学字符识别(OCR)看作一个已经解决的问题,而对于图像中文本的检测和识别运个领 域还有很大的研究空间。国际上对于图像中文本检测和识别的研究已经进行了很多年,有 很多相关的国际竞赛。Robust Reading竞赛(2003,2005,2011,2013),Camera-based Document Analysi s And Recognition(2005-2013,一年两次)。 场景文本检测的方法大致分为Ξ类:基于滑动窗的方法,基于成分连接的方法,混 合方法。 本文中使用的Maximally Sl:able Extremal Regions(MS邸S,最大稳定极值区域) 可W归为基于成分连接的方法。Μ沈Rs(Maximally Stable Extremal Regions,最大稳定极 值区域)该算法最早是由Matas等人于2002年提出,它是基于分水岭的概念,最早用于斑点 检测,后来越来越多的研究者使用它来进行图像中的文本检测。MSER的基本原理是对一幅 灰度图像(灰度值为0~255)取阔值进行二值化处理,阔值从0到255依次递增。阔值的递增 类似于分水岭算法中的水面的上升,随着水面的上升,有一些较矮的丘陵会被淹没,如果从 天空往下看,则大地分为陆地和水域两个部分,运类似于二值图像。在得到的所有二值图像 中,图像中的某些连通区域变化很小,甚至没有变化,则该区域就被称为最大稳定极值区 域。数学原理如下: 图像I作为一个映射一 X,极值区域可W定义在图片上,如果: 1.S 是完全有序的 5={1,2,···255} 2.定义一个连接关系 [000引区域Q是D的连续子集。区域边缘:巡二{q坛DU):亦Ε谷:於似极值区域化Rs):对谷[0,对所有只€谷,g € 00 : /灶)> I(q):(或者 公居 0,皆 E a0 : /(P) < i(q))。[00川最大稳定极值区域(ΜSERS):对于一组内嵌的极值区域谷1,…,資? - 1,谷?:,... 讼/ C 0/+i),对于q(i) = I Qi+A-Qi-A I/Qi当且仅当在i处取到局部最小值时,就称化是最 稳定的,其中,heS。
技术实现思路
本专利技术的主要目的在于提供。 本专利技术的技术方案为: -种复杂背景图像中的文本定位方法,其步骤为:[001引1)在待处理的彩色图像的R、G和ΒΞ个通道上分别使用MSERs算法进行处理,得到 对应Ξ个通道上的MSERs区域;然后将得到的结果标记在该彩色图像上,得到每个MSERs区 域在彩色图像上的坐标; 2)对得到的MSERs区域进行初步去噪,去掉判断为重复的MSERs区域和非文本的 MSERs区域,得到候选MSERs区域; 3)从得到的候选MSERs区域中提取设定特征,然后利用一基于该设定特征训练的 分类器对候选MSERs区域分类,得到包含文本的MSEIis区域,即文本块; 4)将得到的文本块连接成文本条; 5)对得到的文本条进行去重处理。 进一步的,对得到的MSERs区域进行初步去噪的方法为:根据每个MSERs区域在彩 色图像上的坐标计算两MS邸S区域的重叠面积,将重叠面积占运两个区域合并后的面积比 例超过设定比例阔值时,判定运两个MSERs区域是重复的,并去掉其中面积较小的一个 MSERs区域;然后计算剩余MSERs区域内包含的小区域数量,如果该MS邸S区域包含的小区域 数量超过设定阔值,则将该MSERs区域剔除掉;其中将区域的面积与该区域所在MSERs区域 面积的比值小于设定阔值的区域称为小区域。 进一步的,将得到的文本块连接成文本条的方法为:将两个文本块之间的距离小 于设定距离阔值且相似度大于设定相似度阔值的文本块连接起来,将剩余的独立的文本块 连接成文本条,得到一个或多个文本条。 进一步的,所述距离阔值设为该代理处理彩色图像的宽度的8%。 进一步的,对得到的文本条进行去重处理的方法为:采用随机森林分类器对得到 的每一文本条进行投票,如果投票率小于设定阔值,则将该文本条作为非文本剔除掉;对于 剩余文本条,计算两文本条交叉部分面积占运两文本条合并部分面积的比例,如果该比例 超过设定比值,则将面积较小的文本条删除。 进一步的,对得到的文本条进行去重处理的方法为:如果一个文本条包含若干小 的文本条,则将运些小的文本条删除。 进一步的,所述设定特征为化g特征,所述分类器为SVM分类器。 与现有技术相比,本专利技术的积极效果为: 在我们自己的图像库上进行实验对比,我们方法F-measure达到85%,性能优于已 有的state-〇f-a;rt方法的75.5%,大大提高了文本定位效率。【附图说明】 附图为本专利技术的方法流程图。【具体实施方式】 为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本 专利技术做进一步说明。 MSERs方法往往使用在灰度图上,但是在灰度图上由于在彩色图转化为灰度图的 过程中一些信息的丢失,造成一些必要的信息定位不到,所W我们把基于灰度图的MS邸S算 法扩展到了R,G,B^通道,对于一张彩色图像,我们在运张彩色图像的R,G和ΒΞ个通道上分 别使用MS邸S算法进行处理,在Ξ通道上各设置最小为3的像素变化值和最小区域为30像素 的阔值,运样得到Ξ个通道上的MSERs区域,再把得到的结果标记在原来的彩色图像上,得 到每个MSERs区域在彩色图像上的坐标,去掉中屯、坐标和宽高完全一致的区域,最后综合起 来进行处理。 由于得到大量的MSERs区域中有很多的噪声即非文本区域,像树叶、人、建筑等等, 所W要对得到的MSERs区域要进行去噪声和筛选,即去掉非文本部分、筛选出合适的文本 框。对得到的MSERs区域处理主要分为四部分:初步去噪^候选区域筛选^字符块连接^文 本去重。 初步去噪: 根据前面得到的区域坐标和宽高信息计算区域是否重叠,如果两个区域重叠在一 起且重叠面积超过两个区域面积并的80%,就可W认为运两个区域是重复的。对于重叠区 域,去掉其中面积较小的一个,最终去掉一部分重合区域;根据文字的形态特征,文本区域 里经常也会包本文档来自技高网...
【技术保护点】
一种复杂背景图像中的文本定位方法,其步骤为:1)在待处理的彩色图像的R、G和B三个通道上分别使用MSERs算法进行处理,得到对应三个通道上的MSERs区域;然后将得到的结果标记在该彩色图像上,得到每个MSERs区域在彩色图像上的坐标;2)对得到的MSERs区域进行初步去噪,去掉判断为重复的MSERs区域和非文本的MSERs区域,得到候选MSERs区域;3)从得到的候选MSERs区域中提取设定特征,然后利用一基于该设定特征训练的分类器对候选MSERs区域分类,得到包含文本的MSERs区域,即文本块;4)将得到的文本块连接成文本条;5)对得到的文本条进行去重处理。
【技术特征摘要】
【专利技术属性】
技术研发人员:谢洪涛,刘顺,谭建龙,戴琼,
申请(专利权)人:中国科学院信息工程研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。