【技术实现步骤摘要】
一种基于多层次最大稳定极值区域的自然场景文本检测方法
本专利技术涉及自然场景下的文本检测
,特别是,涉及一种基于多层次最大稳定极值区域的自然场景文本检测方法。
技术介绍
目前,基于文本具有高度的概括性和抽象的描述能力,自然场景文本检测技术在智能交通系统、视障人导盲、基于内容的图像检索以及便携式视觉系统等方面具有重要的应用,随着互联网技术以及便携式移动设备的高速发展,越来越多的应用场景需要利用图像中的文本信息,目前自然场景文本检测已成为计算机视觉与模式识别、文档分析与识别领域的一个研究热点。最大稳定极值区域(MSER)基于分水岭的概念,该方法取[0,255]范围的阈值对图像进行二值化处理,有些连通区域面积随阈值上升的变化很小,定义该类区域为最大稳定极值区域(MSER),根据此原理来初步获取图像的文本区域,是一种综合性能比较好的传统自然场景文本检测方法,但存在着文本召回率较低,且夹杂大量非文本区域的问题,基于此,设计了一种基于多层次最大稳定极值区域(MSER)的自然场景文本检测方法,着重解决上述两个问题。< ...
【技术保护点】
1.一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于,包括以下步骤:/n对待检测图像进行锐化处理;/n对锐化后图像进行候选文本区域的提取;/n对候选文本区域进行筛选,得到最终的文本区域。/n
【技术特征摘要】
1.一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于,包括以下步骤:
对待检测图像进行锐化处理;
对锐化后图像进行候选文本区域的提取;
对候选文本区域进行筛选,得到最终的文本区域。
2.根据权利要求1所述一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于:对所述图像进行基于拉普拉斯变换的图像锐化,可以起到对图像的文本区域边界的增强效果,其拉普拉斯算子如下所示:
则得到锐化图像:
其中:g(x,y)为锐化后的图像;f(x,y)为输入图像,
3.根据权利要求2所述一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于:对所述锐化后的图像进行尺寸统一。
4.根据权利要求1所述一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于:对所述尺寸统一后图像(RGB图像),进行颜色通道的分离,具体为将其转化为R、G、B、H、S、I、Gray七种单颜色通道图像,具体为:
R=(r)
G=(g)
B=(b)
Gray=r*0.299+g*0.587+b*0.114;
其中:r,g,b分别为原RGB图像的三通道像素值。
5.根据权利要求4所述一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于:将所述七种单颜色通道图像,通过高斯卷积核构造尺度空间,获得不同尺度下的图像,高斯卷积核的求取公式为:
其中:H(i,j)为卷积核坐标;k为卷积核大小;σ为变量,通过调整σ为三种不同大小来改变高斯核的取值。
6.根据权利要求5所述一种基于多层次最大稳定极值区域的自然场景文本检测方法,其特征在于:将所述高斯卷积核与上述七种单颜色通道图像进行卷积操作,至...
【专利技术属性】
技术研发人员:王彦,张薇薇,张承模,张庆伟,胡星,周在邦,韩胜国,王勋,田恩勇,付龙明,黄辉,魏子欣,
申请(专利权)人:贵州电网有限责任公司,
类型:发明
国别省市:贵州;52
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。