一种基于多层次最大稳定极值区域的自然场景文本检测方法技术

技术编号:24757977 阅读:93 留言:0更新日期:2020-07-04 09:34
本发明专利技术提供一种基于多层次最大稳定极值区域的自然场景文本检测方法。所述方法包括:对待检测图像进行锐化处理;对所述锐化后图像进行候选文本区域的提取;对所述候选文本区域进行筛选,得到最终的文本区域。使用本方法可以有效提高传统MSER文本检测方法的文本召回率及检测准确率,且实时性较强。

A text detection method for natural scenes based on multi-level maximum stable extremum region

【技术实现步骤摘要】
一种基于多层次最大稳定极值区域的自然场景文本检测方法
本专利技术涉及自然场景下的文本检测
,特别是,涉及一种基于多层次最大稳定极值区域的自然场景文本检测方法。
技术介绍
目前,基于文本具有高度的概括性和抽象的描述能力,自然场景文本检测技术在智能交通系统、视障人导盲、基于内容的图像检索以及便携式视觉系统等方面具有重要的应用,随着互联网技术以及便携式移动设备的高速发展,越来越多的应用场景需要利用图像中的文本信息,目前自然场景文本检测已成为计算机视觉与模式识别、文档分析与识别领域的一个研究热点。最大稳定极值区域(MSER)基于分水岭的概念,该方法取[0,255]范围的阈值对图像进行二值化处理,有些连通区域面积随阈值上升的变化很小,定义该类区域为最大稳定极值区域(MSER),根据此原理来初步获取图像的文本区域,是一种综合性能比较好的传统自然场景文本检测方法,但存在着文本召回率较低,且夹杂大量非文本区域的问题,基于此,设计了一种基于多层次最大稳定极值区域(MSER)的自然场景文本检测方法,着重解决上述两个问题。<br>
技术实现思路
<本文档来自技高网
...

【技术保护点】
1.一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于,包括以下步骤:/n对待检测图像进行锐化处理;/n对锐化后图像进行候选文本区域的提取;/n对候选文本区域进行筛选,得到最终的文本区域。/n

【技术特征摘要】
1.一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于,包括以下步骤:
对待检测图像进行锐化处理;
对锐化后图像进行候选文本区域的提取;
对候选文本区域进行筛选,得到最终的文本区域。


2.根据权利要求1所述一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于:对所述图像进行基于拉普拉斯变换的图像锐化,可以起到对图像的文本区域边界的增强效果,其拉普拉斯算子如下所示:



则得到锐化图像:



其中:g(x,y)为锐化后的图像;f(x,y)为输入图像,


3.根据权利要求2所述一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于:对所述锐化后的图像进行尺寸统一。


4.根据权利要求1所述一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于:对所述尺寸统一后图像(RGB图像),进行颜色通道的分离,具体为将其转化为R、G、B、H、S、I、Gray七种单颜色通道图像,具体为:
R=(r)
G=(g)
B=(b)












Gray=r*0.299+g*0.587+b*0.114;
其中:r,g,b分别为原RGB图像的三通道像素值。


5.根据权利要求4所述一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于:将所述七种单颜色通道图像,通过高斯卷积核构造尺度空间,获得不同尺度下的图像,高斯卷积核的求取公式为:



其中:H(i,j)为卷积核坐标;k为卷积核大小;σ为变量,通过调整σ为三种不同大小来改变高斯核的取值。


6.根据权利要求5所述一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于:将所述高斯卷积核与上述七种单颜色通道图像进行卷积操作,至...

【专利技术属性】
技术研发人员:王彦张薇薇张承模张庆伟胡星周在邦韩胜国王勋田恩勇付龙明黄辉魏子欣
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:贵州;52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1