一种图像检测方法和装置制造方法及图纸

技术编号：15641277 阅读：88 留言：0更新日期：2017-06-16 11:09

本发明专利技术实施例公开了一种图像检测方法和装置。其中，一种图像检测方法，包括获取待检测图像，从所述待检测图像中提取最大稳定极值MSER区域，其中，所述MSER区域为连通区域，过滤所述MSER区域，得到所述待检测图像中的文本区域。通过从待检测图像中提取MSER区域，以划分连通区域的方式提取MSER区域作为候选区域，再对提取到的MSER区域进行过滤筛选，最终得到待检测图像中的文本区域，区域划分有利于减少计算量、提高检测效率，同时提取MSER区域可减少图像背景的干扰，可提高在检测背景复杂的图像时的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像检测方法和装置
本专利技术涉及图像处理
，尤其涉及一种图像检测方法和装置。
技术介绍
随着数码摄像设备的成熟和普及，人们已经能够非常方便快捷地记录现实世界在不同视角下的方方面面。而作为人类语言的可视化文本，在人类活动中具有特殊而不可替代的地位。自然场景文字检测是计算机视觉与模式识别技术在目标检测与识别领域中的重要研究课题之一。该技术目的在于在所拍摄的自然场景图像中准确地检测出文字信息，其在自然场景理解与分析、机器人辅助导航、视频检索、盲人辅助阅读及文字翻译等方面有广泛的应用前景。目前，自然场景文本检测方法分为两种：基于滑动窗口的方法和基于连通区域的方法。基于滑动窗口的方法，是指将多尺度的窗口在图像中从左到右、从上到下进行滑动，并对滑动窗口内的图像进行分类，判断其是否为文字区域，为了能够检测所有的文本区域，该方法通常需要大量的滑动窗口，导致计算复杂度增高，并不能达到实时的要求。基于连通区域的方法，是指根据文本固有的属性，如颜色、纹理、笔划宽度等，对像素进行相似性聚类，生成大量的连通区域，并对连通区域进行特征(如文字高度、宽度和间距等)提取，过滤非文本区域，从而完成文本检测，相对于基于滑动窗口的方法，该方法的计算量相对减少，但是对要求连通区域的提取有很高的要求，即所提取的连通区域要包括所有的文字区域，并且很难有效地应对复杂背景的情况。
技术实现思路
为解决相关技术问题，本专利技术提供一种图像检测方法和装置，可实现快速、准确地在复杂自然场景中提检测出文字区域。为实现上述目的，本专利技术实施例采用如下技术方案：第一方面，本专利技术实施例提供了一种图像检测...

【技术保护点】
一种图像检测方法，其特征在于，包括：获取待检测图像；从所述待检测图像中提取最大稳定极值MSER区域，其中，所述MSER区域为连通区域；过滤所述MSER区域，得到所述待检测图像中的文本区域。

【技术特征摘要】
1.一种图像检测方法，其特征在于，包括：获取待检测图像；从所述待检测图像中提取最大稳定极值MSER区域，其中，所述MSER区域为连通区域；过滤所述MSER区域，得到所述待检测图像中的文本区域。2.如权利要求1所述的方法，其特征在于，所述接收待检测图像之前，还包括：接收初始图像；对所述初始图像进行颜色空间转换，以获得所述待检测图像。3.如权利要求2所述的方法，其特征在于，所述从所述待检测图像中提取最大稳定极值MSER区域，包括：对所述待检测图像进行二值化处理，调节二值化阈值在[0,255]范围内变化，当所述连通区域的面积变化幅度V(i)小于设定的变化幅度值时，确定所述连通区域为MSER区域；其中，Qi表示所述二值化阈值为i时所述连通区域的面积，Δ表示所述二值化阈值的微小变化。4.如权利要求3所述的方法，其特征在于，所述对所述过滤所述MSER区域，得到所述待检测图像中的文本区域，包括：统计所述MSER区域的像素值或区域长宽比；将像素值小于预设像素阈值或区域长宽比不在预设范围内的MSER区域过滤。5.如权利要求4所述的方法，其特征在于，所述将像素值小于预设像素阈值或区域长宽比不在预设范围内的MSER区域过滤之后，还包括：连续对过滤后剩余的MSER区域进行卷积和下采样处理，获得特征映射图；将所述特征映射图输入到分类器中，根据所述分类器的输出结果确定MSER区域为文本区域。6.如权利要求1-5任一项所述的方法，其特征在于，所述过滤所述MSER区域，得到所述待检测图像中的文本区域之后，还包括：在水平方向上合并相邻文本...

【专利技术属性】
技术研发人员：李红匣，
申请(专利权)人：广州视源电子科技股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人