一种在任意自然场景下检测行文本的方法技术

技术编号：13668946 阅读：37 留言：0更新日期：2016-09-07 11:44

本发明专利技术提供一种在任意自然场景下检测行文本的方法，包括：在待检测图像中，通过比较各像素点的像素值来找出像素值极值点，然后基于所述极值点回溯扩展得到文本字符可能出现的所有区域；排除噪声区域；利用霍夫变换，基于剩余区域的中心映射在二维坐标系中的坐标点找出所有可能角度的直线，并最终通过非极大值抑制的方法确定一条最佳斜率的直线，以该直线上对应的区域作为检测到的行文本。本发明专利技术的方法通过快速分析所有像素中所有的可能构成字符的区域，并利用霍夫变换找出所有可能的角度，不依赖字符边缘，对光照和清晰度的影响较小。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机图像处理领域，用于快速检测图像或视频中自然场景下的行文本。
技术介绍
随着科学技术的发展，人们获取图像的手段日益多元化，数码相机、摄像头、扫描仪等等设备都称为了广泛应用的图像获取设备。获取的各种图像中包含很多有用的文本信息，如字幕、车牌字符、广告标语等，从视频或图像中直接获取这些文本信息将为人们的工作提供极大的便利，这个获取过程就是一种文本检测过程。现阶段，图像中的文本检测在包括图像或视频检索、网络过滤、智能交通、数字图书馆等多个领域具有广泛应用前景和需求，因此，准确地从图像或视频中检测定位出文本是数字图象处理中的一个重要研究内容。光学字符识别技术(Optical Character Recongnition，OCR)从20世纪70年代兴起，发展到现在已经非常成熟，其针对高分辨率的文档识别具有跟高的准确率，因此得到了广泛的应用。但是，现有的OCR技术只针对扫描仪得到的高分辨率、规整的文档图像具有良好的识别能力，而对于嵌在背景图像中的文本则不能进行有效识别。因此，在自然场景中提取文本成为了图像处理领域需要解决的热点问题。现有技术中用于自然场景中文本检测和定位的方法有很多，例如，基于连通区域的文本定位算法、基于纹理的文本定位算法和基于边缘的文本定位算法等等。但这些方法各自都有局限性，比如，基于连通区域的文本定位算法主要适用于图像中文本颜色相同、文本在图像中占很大比例并且背景简单的情况，适应性差；基于纹理的文本定位算法在检测文本时需要先计算图像的纹理特征，而图像的纹理特征计算复杂度相对较高，而且在背景相对复杂的情况下，文本区域容易与背景区域...

【技术保护点】
一种在任意自然场景下检测行文本的方法，其特征在于：在待检测图像中，通过比较各像素点的像素值来找出像素值极值点，然后基于所述极值点回溯扩展得到文本字符可能出现的所有区域；排除噪声区域；利用霍夫变换，基于剩余区域的中心映射在二维坐标系中的坐标点找出所有可能角度的直线，并最终通过非极大值抑制的方法确定一条最佳斜率的直线，以该直线上对应的区域作为检测到的行文本。

【技术特征摘要】
1.一种在任意自然场景下检测行文本的方法，其特征在于：在待检测图像中，通过比较各像素点的像素值来找出像素值极值点，然后基于所述极值点回溯扩展得到文本字符可能出现的所有区域；排除噪声区域；利用霍夫变换，基于剩余区域的中心映射在二维坐标系中的坐标点找出所有可能角度的直线，并最终通过非极大值抑制的方法确定一条最佳斜率的直线，以该直线上对应的区域作为检测到的行文本。2.权利要求1所述的方法，其特征在于：所述的通过比较各像素点的像素值来找出像素值极值点的过程具体是将每个像素点都与相邻的所有未被比较过的像素点逐一做比较，记录每次比较得到的高像素值的点；然后进一步在得到的所有高像素值中找到最高值并回溯拓展得到相应区域。3.权利要求2所述的方法，其特征在于：所述的将每个像素点都与相邻的所有未被比较过的像素点逐一做比较，记录每次比较得到的高像素值的点的过程包括：将任意一个像素点作为当前点，将其和相邻的所有未访问过的像素点逐一比较像素值，只要出现像素值高于当前点的像素点，即将该点作为新的当前点继续与其相邻的所有未访问过的像素点逐一比较像素值，整个比较过程中记录每次比较得到的高像素值的点，同时将所有参与比较的像素点标记为已访问过；直到当前点周围没有未访问过的像素点时停止比较，并将最后的当前点记录下来。4.权利要求1所述的方法，其特征在于：所述的排除噪声区域是，根据经确定和修正的所有文本字符可能出现的区域的规格做一个过滤，把明显不符合字符大小的区域过滤掉。5.权利要求1所述的方法，其特征在于，通过计算机程序完成以下步骤：1)定义一个region，表示可能的文本字符；同时定义一个heap和一个stack，可存放region；再定义一个与图像大小相同的access map，其中所有点的对应值为0或1；初始化所有点对应值为0；2)标记任意一个像素为当前点，将其access map对应值修改为1；3)将一个空的region压入步骤1)定义的stack；4)根据更新后的access map判断当前点周围有没有access map中对应值为0的点；根据判断结果做如下处理：4.1)有，则比较该点的像素值是否小于当前点像素值，将比较中参与过比较的点的access map中对应值改为1，并根据判定结果进一步做如下处理：4.1.1)不小于，则将该点记录在步骤1)定义的...

【专利技术属性】
技术研发人员：石柱国，
申请(专利权)人：北京以萨技术股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人