【技术实现步骤摘要】
一种结合最大极值稳定区域和笔画宽度变化的文本定位方法
本专利技术涉及人工智能计算机领域中的图像处理,特别涉及一种利用图像处理来实现自然场景中的文本定位方法。
技术介绍
在进行自然场景文本定位的过程中,有一个基本的而且不可避免的问题:对有着复杂自然背景的图像来说,如何避免文本布局、字体类型、光照强度及拍摄角度等因素影响,准确获取文本位置。文本定位在文本检测过程中是至关重要的,文本定位效果的好坏直接决定了之后文本分割以及文本识别的准确度。文本定位在自然场景中的应用越来越广泛,然而复杂的自然场景环境给这项技术带来了许多挑战。不同于传统的文本定位技术,自然场景中有着大量的干扰物,同时拍摄角度及字体等因素会使文本发生形变,使文本定位更加困难。因此,需要寻找文本特征,使文本定位过程不受这些因素的影响。自然场景中文本定位的方法有很多,主要分为滑动窗口方法和连通域分析方法两类。滑动窗口方法利用一个移动的窗口对图像的所有位置进行文本检测,连通域分析方法通过选取图像特征来获取候选连通域,筛选合并后实现文本定位。在自然场景文本定位中,常遇到几个难题需要解决:1)文本特征提取是一个自然场 ...
【技术保护点】
一种结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述文本定位方法包括如下步骤:(1)利用MSER进行对文本域进行检测:对原始图像进行灰度化,并用0‑255的整数来表示图像中各像素点的灰度值;在图像灰度值范围内任取一阈值,灰度值小于阈值的像素点定义为黑色,大于阈值的像素点为白色,当阈值为0时,整个图像为白色,在阈值从0到255变化过程中,黑色区域稳定不变且区域梯度最小,则该区域为最大稳定极值区域;(2)Canny算子边缘化处理图像:利用高斯滤波器平滑图像,对滤波后的图像计算其梯度幅度和梯度方向,对梯度幅度进行非极大值抑制,找出图像梯度中的局部极大值点,并将非 ...
【技术特征摘要】
1.一种结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述文本定位方法包括如下步骤:(1)利用MSER进行对文本域进行检测:对原始图像进行灰度化,并用0-255的整数来表示图像中各像素点的灰度值;在图像灰度值范围内任取一阈值,灰度值小于阈值的像素点定义为黑色,大于阈值的像素点为白色,当阈值为0时,整个图像为白色,在阈值从0到255变化过程中,黑色区域稳定不变且区域梯度最小,则该区域为最大稳定极值区域;(2)Canny算子边缘化处理图像:利用高斯滤波器平滑图像,对滤波后的图像计算其梯度幅度和梯度方向,对梯度幅度进行非极大值抑制,找出图像梯度中的局部极大值点,并将非局部最大值点置零,以此细化图像边缘,用双阈值算法检测和连接边缘;(3)获取图像笔画宽度特征:对每一个边缘像素点,在垂直于边缘的梯度方向上定义一条射线,沿射线方向寻找对应的另一边缘像素点,在梯度方向上找到另一边缘像素点,且该点的梯度方向与原梯度方向近似相反,则这两个边缘像素点的距离被认为是笔画宽度;未找到对应像素点或对应像素点梯度方向不近似相反,则丢弃该射线,在更为复杂的笔画环境中,沿未舍弃的射线计算所有像素点的笔画宽度中值m,并将射线上所有笔画宽度值大于m的像素点笔画宽度中值都设为m;(4)形态学运算处理图像:对图像使用开、闭运算,开运算先对图像进行腐蚀操作,去除图像的边缘毛刺,然后进行膨胀操作,填充图像细小缝隙和小孔,闭运算先进行膨胀操作,填补图像的断裂区域,轮廓缺口,然后进行腐蚀操作,平滑图像边缘;(5)候选文本域生成:将文本像素点根据规则聚集成候选文本域,相邻像素点笔画宽度值在阈值范围内则归为同一连通域,计算连通域的宽高比及面积比,将超过阈值范围的连通域作为非文本域滤除;(6)文本域合并:对单字文本域作进一步过滤,相邻单字文本域内笔画宽度均值比、高度比、及像素点颜色均值比超过阈值,将偏差较大的连通域作为噪声滤除,将剩余连通域聚集成连,形成连续文本域。2.根据权利要求1所述的结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述利用MSER进行对文本域进行检测的步骤中,最大稳定极值区域是一种依赖于区域内部和边界像素关系,根据稳定性判定条件来获取最大稳定极值区域的算法;对于输入图像进行灰度化,在0-255的图像灰度值范围内任取一阈值,Q1,….,Qi,…是一系列嵌套极值区域,且满足q(i)=|Qi+Δ\Qi-Δ|/|Qi|在i*有局部最小值,则Qi*是最大极值稳定区域MSER。3.根据权利要求1所述的结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述的Canny算子边缘检测是基于最优化思想的边缘检测算子,该算法采用合适的二维高斯函数分别按行和列对图像进行平滑去噪,计算图像梯度的幅度和方向,并通过对梯度幅度的最大值抑制,来找到图像梯度中的局部极大值点,置零非局部极大值点,使边缘得以细化,采用T1、T2双阈值算法检测,用T1来获得每一条线段,用T2来在线段两边寻找断裂处,并连接边缘;其中,所...
【专利技术属性】
技术研发人员:张再跃,潘立,刘亮亮,刘嘎琼,武子毅,
申请(专利权)人:江苏科技大学,江苏科技大学海洋装备研究院,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。