一种图像检测方法和装置制造方法及图纸

技术编号:15641277 阅读:88 留言:0更新日期:2017-06-16 11:09
本发明专利技术实施例公开了一种图像检测方法和装置。其中,一种图像检测方法,包括获取待检测图像,从所述待检测图像中提取最大稳定极值MSER区域,其中,所述MSER区域为连通区域,过滤所述MSER区域,得到所述待检测图像中的文本区域。通过从待检测图像中提取MSER区域,以划分连通区域的方式提取MSER区域作为候选区域,再对提取到的MSER区域进行过滤筛选,最终得到待检测图像中的文本区域,区域划分有利于减少计算量、提高检测效率,同时提取MSER区域可减少图像背景的干扰,可提高在检测背景复杂的图像时的准确率。

【技术实现步骤摘要】
一种图像检测方法和装置
本专利技术涉及图像处理
,尤其涉及一种图像检测方法和装置。
技术介绍
随着数码摄像设备的成熟和普及,人们已经能够非常方便快捷地记录现实世界在不同视角下的方方面面。而作为人类语言的可视化文本,在人类活动中具有特殊而不可替代的地位。自然场景文字检测是计算机视觉与模式识别技术在目标检测与识别领域中的重要研究课题之一。该技术目的在于在所拍摄的自然场景图像中准确地检测出文字信息,其在自然场景理解与分析、机器人辅助导航、视频检索、盲人辅助阅读及文字翻译等方面有广泛的应用前景。目前,自然场景文本检测方法分为两种:基于滑动窗口的方法和基于连通区域的方法。基于滑动窗口的方法,是指将多尺度的窗口在图像中从左到右、从上到下进行滑动,并对滑动窗口内的图像进行分类,判断其是否为文字区域,为了能够检测所有的文本区域,该方法通常需要大量的滑动窗口,导致计算复杂度增高,并不能达到实时的要求。基于连通区域的方法,是指根据文本固有的属性,如颜色、纹理、笔划宽度等,对像素进行相似性聚类,生成大量的连通区域,并对连通区域进行特征(如文字高度、宽度和间距等)提取,过滤非文本区域,从而完成文本检测,相对于基于滑动窗口的方法,该方法的计算量相对减少,但是对要求连通区域的提取有很高的要求,即所提取的连通区域要包括所有的文字区域,并且很难有效地应对复杂背景的情况。
技术实现思路
为解决相关技术问题,本专利技术提供一种图像检测方法和装置,可实现快速、准确地在复杂自然场景中提检测出文字区域。为实现上述目的,本专利技术实施例采用如下技术方案:第一方面,本专利技术实施例提供了一种图像检测方法,包括:获取待检测图像;从所述待检测图像中提取最大稳定极值MSER区域,其中,所述MSER区域为连通区域;过滤所述MSER区域,得到所述待检测图像中的文本区域。第二方面,本专利技术实施例还对应地提供了一种图像检测装置,包括:待检测图像获取模块,用于获取待检测图像;MSER区域提取模块,用于从所述待检测图像中提取最大稳定极值MSER区域,其中,所述MSER区域为连通区域;MSER区域过滤模块,用于过滤所述MSER区域,得到所述待检测图像中的文本区域。本专利技术实施例提供的技术方案带来的有益效果:本技术方案中,获取待检测图像,从待检测图像中提取最大稳定极值MSER区域,其中,最大稳定极值区域为连通区域,过滤MSER区域,得到待检测图像中的文本区域。通过从待检测图像中提取MSER区域,以划分连通区域的方式提取MSER区域作为候选区域,再对提取到的MSER区域进行过滤筛选,最终得到待检测图像中的文本区域,区域划分有利于减少计算量、提高检测效率,同时提取MSER区域可减少图像背景的干扰,可提高在检测背景复杂的待检测图像时的准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本专利技术实施例的内容和这些附图获得其他的附图。图1是本专利技术实施例一提供的一种图像检测方法的流程示意图;图2A是本专利技术实施例二提供的一种图像检测方法的流程示意图;图2B是图2A中S250的可选实施方式的流程示意图;图2C是本专利技术实施例二中使用的卷积神经网络模型的结构示意图;图3是本专利技术实施例三提供的一种图像检测装置的架构示意图;图4A是本专利技术实施例四提供的一种图像检测装置的架构示意图;图4B是图4A中MSER区域过滤模块450的可选实施方式的架构示意图。具体实施方式为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本专利技术实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一请参考图1,其是本专利技术实施例一提供的一种图像检测方法的流程示意图。本实施例的方法可以由配置有摄像头的智能手机、平板电脑或笔记本电脑等移动设备来执行,可适用于检测识别自然场景图像中文本区域的情况。本实施例提供的一种图像检测方法,可以包括以下步骤:S110:获取待检测图像。示例性的,在本专利技术实施例中,待检测图像可以为原始图像,也可以为对原始图像经过预处理的得到的图像。在本专利技术的一个实施例中,优选将原始图像进行预处理得到待检测图像。S120:从待检测图像中提取最大稳定极值MSER区域。示例性的,最大稳定极值(MaximallyStableExtrernalRegions,MSER)区域是指待检测图像经过一定的阈值变化后形成的连通区域,可以从待检测图像中提取出多个MSER区域,可以连通区域的最小外接矩形来表示MSER区域。其中,同一个连通区域内的颜色、纹理、字符笔画宽度等特征基本相同。在待检测图像中所显示的每个矩形框均代表一个MSER区域,可以从待检测图像中提取出多个MSER区域,也可能提取不出MSER区域,即待检测图像中没有文本区域。S130:过滤MSER区域,得到待检测图像中的文本区域。示例性的,过滤MSER区域的方法有很多,例如根据MSER区域的区域特征来过滤。在本专利技术的实施例二提供了一种过滤MSER区域的可选实施方式,在此不加以赘述。综上,在本技术方案中,获取待检测图像,从待检测图像中提取最大稳定极值MSER区域,其中,最大稳定极值区域为连通区域,过滤MSER区域,得到待检测图像中的文本区域。通过从待检测图像中提取MSER区域,以划分连通区域的方式提取MSER区域作为候选区域,再对提取到的MSER区域进行过滤筛选,最终得到待检测图像中的文本区域,区域划分有利于减少计算量、提高检测效率,同时提取MSER区域可减少图像背景的干扰,可提高在检测背景复杂的图像时的准确率。实施例二请参考图2A、图2B和图2C,其中,图2A是本专利技术实施例二提供的一种图像检测方法的流程示意图,图2B是图2A中S250的可选实施方式的流程示意图,图2C是本专利技术实施例二中使用的卷积神经网络模型的结构示意图。本实施例与实施例一的主要区别在于,在实施例一的基础上增加了S210、S220、S260和S270的内容,并进一步提供了S250的可选实施方式。本实施例提供的一种图像检测方法,可以包括如下步骤:S210:接收初始图像。示例性的,初始图像可以是通过摄像头拍摄自然场景得到的图像,通常是RGB图像。S220:对初始图像进行颜色空间转换,以获得待检测图像。示例性的,通过对初始图像进行颜色空间转换,得到R、G、B、Grayscale、H、S、V共7个通道的图像,作为待检测图像,后续步骤中均是对这7个图像进行操作。S230:获取待检测图像。S240:从待检测图像中提取最大稳定极值MSER区域。示例性的,可以通过MSER算法从待检测图像中提取MSER区域,主要过程为:对待检测图像进行二值化处理,调节二值化阈值在[0,255]范围内变化,当连通区域的面积变化幅度V(i)小于设定的变化幅度值时,确定连通区域为MSER区域;举例来说,对检测图像的灰度图二值化处理时,将像素值小于二值化阈值的像素点均设置像素值为0,本文档来自技高网...
一种图像检测方法和装置

【技术保护点】
一种图像检测方法,其特征在于,包括:获取待检测图像;从所述待检测图像中提取最大稳定极值MSER区域,其中,所述MSER区域为连通区域;过滤所述MSER区域,得到所述待检测图像中的文本区域。

【技术特征摘要】
1.一种图像检测方法,其特征在于,包括:获取待检测图像;从所述待检测图像中提取最大稳定极值MSER区域,其中,所述MSER区域为连通区域;过滤所述MSER区域,得到所述待检测图像中的文本区域。2.如权利要求1所述的方法,其特征在于,所述接收待检测图像之前,还包括:接收初始图像;对所述初始图像进行颜色空间转换,以获得所述待检测图像。3.如权利要求2所述的方法,其特征在于,所述从所述待检测图像中提取最大稳定极值MSER区域,包括:对所述待检测图像进行二值化处理,调节二值化阈值在[0,255]范围内变化,当所述连通区域的面积变化幅度V(i)小于设定的变化幅度值时,确定所述连通区域为MSER区域;其中,Qi表示所述二值化阈值为i时所述连通区域的面积,Δ表示所述二值化阈值的微小变化。4.如权利要求3所述的方法,其特征在于,所述对所述过滤所述MSER区域,得到所述待检测图像中的文本区域,包括:统计所述MSER区域的像素值或区域长宽比;将像素值小于预设像素阈值或区域长宽比不在预设范围内的MSER区域过滤。5.如权利要求4所述的方法,其特征在于,所述将像素值小于预设像素阈值或区域长宽比不在预设范围内的MSER区域过滤之后,还包括:连续对过滤后剩余的MSER区域进行卷积和下采样处理,获得特征映射图;将所述特征映射图输入到分类器中,根据所述分类器的输出结果确定MSER区域为文本区域。6.如权利要求1-5任一项所述的方法,其特征在于,所述过滤所述MSER区域,得到所述待检测图像中的文本区域之后,还包括:在水平方向上合并相邻文本...

【专利技术属性】
技术研发人员:李红匣
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1