一种基于交互平台的复杂背景中文本的快速检测方法技术

技术编号：13013489 阅读：52 留言：0更新日期：2016-03-16 10:45

本发明专利技术公开了一种基于交互平台的复杂背景中文本的快速检测方法，它包括以下步骤：S1：输入图像预处理；S2：文本候选区域快速定位：对步骤S1预处理后的图像作轮廓检测，并用矩形框将每个闭合区域框选出来，然后通过SIFT算法快速定位每个矩形框中的所有角点，将角点个数作为初步筛选条件进行初步筛选；S3：通过归一化算法首先将图像调整到统一的大小，再通过前向映射的方法将原图像中的内容投射到归一化后的图片的正中心，并适当的修正角度；S4：文本/背景筛选：首先提取特征，经过训练后的分类器筛选后的候选区域为检测出的文本区域。本发明专利技术实现复杂背景中的文本检测，其解决的主要问题是如何在保持较高精度情况下快速定位图像中水平及带有旋转角度的文本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉和人机交互领域，尤其涉及一种基于交互平台的复杂背景中文本的快速检测方法。
技术介绍
复杂背景中的文本检测问题，在计算机视觉领域和人机交互领域都视为一个经典难题。原因有两点，首先这项技术有着广泛的应用。比如，可以利用这项技术让手机等智能设备为我们读书念报，或应用于无人车上让车辆自动识别路标路牌。其次，文本检测问题有时非常难解决的，因为文本检测不同于人脸、车辆、行人等一般的目标检测。文本的形状更加多变（往往出现不同程度的形变、模糊），与背景更加相似，并且计算时间复杂度很高。对于复杂背景的文本检测，目前主要有三种方法：1.基于纹理的文本检测方法。 2.基于区域的文本检测方法。3.基于深度学习的方法。基于纹理的文本检测方法，是把复杂背景中的文本视为一种特殊的纹理。通常采用滑动窗的方法进行纹理提取，再用Gabor滤波等对光线鲁棒对边缘信息敏感的滤波器进行图像预处理，最后用灰度直方图的方法统计图像中的像素分布情况进而确定滑动窗中是否有文本存在。其缺点是对背景较为复杂的图片处理效果不好，并且由于用到了滑动窗方法其计算效率是非常低的。基于区域的文本检测方法，是人文复杂背景中的文本都是一种局部连通的特殊区域。其基本思想是利用连通区域提取算法将图像中的所有连通部分提取出来，然后用训练分类器或制定筛选规则将文本部分与背景部分进行区分，最后再将所得到的文本进行整合。其缺点在于过于依赖于连通区域的提取算法，但SWT或MSER这样的连通区域算法对低对比度图像的提取效果是非常不理想的，从而影响整体的检测率。基于深度...

【技术保护点】
一种基于交互平台的复杂背景中文本的快速检测方法，其特征在于：它包括以下步骤：S1：输入图像预处理：对输入的图像进行预处理操作，增强文本边缘对比度；S2：文本候选区域快速定位：对步骤S1预处理后的图像作轮廓检测，并用矩形框将每个闭合区域框选出来，然后通过SIFT算法快速定位每个矩形框中的所有角点，将角点个数作为初步筛选条件进行初步筛选；S3：候选区域归一化：通过归一化算法首先将图像调整到统一的大小，再通过前向映射的方法将原图像中的内容投射到归一化后的图片的正中心，并适当的修正角度；S4：文本/背景筛选：首先离线的根据训练样本提取具有鲁棒性的特征，经过训练后的分类器筛选后的候选区域为检测出的文本区域。

【技术特征摘要】

【专利技术属性】
技术研发人员：程洪，王光甫，杨路，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人