文字区域检测方法及装置制造方法及图纸

技术编号:18399557 阅读:21 留言:0更新日期:2018-07-08 19:50
本申请公开了文字区域检测方法及装置,其中所述方法包括:构建一组半径连续的局部二值模式LBP算子

【技术实现步骤摘要】
文字区域检测方法及装置
本申请涉及印刷或书写字符识别领域,尤其涉及文字区域检测方法及装置。
技术介绍
随着计算机技术的发展,图像中信息越来越引起人们的关注,文字识别技术应运而生,图像中的文字识别技术得到广泛的应用。在文字识别中,文字包含丰富的边缘信息,并且文字区域通常具有相似笔画宽度,笔画之间的宽度也不会差别很多。这些都是区分文字区域和非文字区域的重要特征。目前图像文字检测方法主要分为:基于文本边缘的方法、基于连通区域的方法、基于纹理的方法、和基于人工智能的方法。基于边缘的文本定位方法,利用字符具有丰富的边缘信息进行检测,可以有效地检测到字符的边缘,具有计算量小、速度快的优点。但是复杂背景的边缘影响文本的准确定位。基于连通域的文本定位方法认为文本区域具有一致的颜色,利用字符颜色与背景有一定的对比度这一特征分割图像,然后对分割后的图像进行连通域分析。适用于文本和背景比较单一、字符颜色一致、光照均匀的图像,但对复杂、分辨率低、噪声高的图像效果很差。基于纹理的文本定位方法稳定性高,能检测复杂背景、对比度小、噪声大的文本,但是计算量大、算法复杂性高,比较耗时,对文本的风格、大小比较敏感。基于人工智能的文本定位方法,其检测的效果严重依赖于特征值的提取和分类器的训练样本,很难训练出一个通用的适合所有图像的分类器。SWT(StrokeWidthTransforms)图像文本定位算法,通过边缘检测,提取图像的边缘及边缘的梯度方向。遍历边缘图像的每一个像素,根据边缘像素的梯度方向,查找其梯度方向相反、角度大致一样的像素,形成像素对。像素对间的宽度即为当前像素的笔画宽度。然后将相邻的、笔画宽度相近的像素点合并,形成连通域。SWT算法有以下缺点:1)由于该算法是针对拉丁文设计的,而汉字与拉丁文有很大的区别,因此对中文的检测效果不理想;2)计算量大,对较大的图像检测时间长;3)该算法中笔画宽度只使用边缘像素对之间的欧氏距离作为当前笔画宽度,而没有考虑边缘像素点的灰度对笔画宽度的影响,精度低。
技术实现思路
为了克服现有技术中存在的不足,本专利技术要解决的技术问题是提供一种计算量较小但准确率和效率较高的文字区域检测方法及装置。为解决上述技术问题,本专利技术的文字区域检测方法,包括:构建一组半径连续的局部二值模式LBP算子r表示LBP算子以被检测点为圆心所覆盖的圆形区域的半径,n表示分布在所述圆形区域的圆周上的采样点个数;使用所述LBP算子检测所述图像中的稳定特征点,所述特征点包括端点、角点和边缘;基于所述特征点形成候选文字区域。作为本专利技术所述方法的改进,所述使用所述LBP算子检测所述图像中稳定的特征点包括:遍历图像点p,依次使用所述LBP算子中的每一LBP算子计算得到一组LBP特征值;根据所述LBP特征值确定图像点p是否为特征点。作为本专利技术所述方法的另一种改进,所述方法还包括:基于边缘特征点对所述候选文字区域进行笔画宽度检测;根据笔画宽度确定所述候选文字区域是否是文字图像区域。作为本专利技术所述方法的又一种改进,所述方法还包括:根据文字图像区域的端点和角点对所述文字图像区域进行分割,得到单个文字矩形区域。作为本专利技术所述方法的进一步改进,所述半径r∈{1…4}像素,所述采样点数n=8、16、16、32。为解决上述技术问题,本专利技术的文字区域检测装置,包括:构建模块,用于构建一组半径连续的局部二值模式LBP算子r表示LBP算子以被检测点为圆心所覆盖的圆形区域的半径,n表示分布在所述圆形区域的圆周上的采样点个数;特征点检测模块,用于使用所述LBP算子检测所述图像中的稳定特征点,所述特征点包括端点、角点和边缘;形成模块,用于基于所述特征点形成候选文字区域。作为本专利技术所述装置的改进,所述检测模块包括:计算子模块,用于遍历图像点p,依次使用所述LBP算子中的每一LBP算子计算得到一组LBP特征值;特征点确定子模块,用于根据所述LBP特征值确定图像点p是否为特征点。作为本专利技术所述装置的另一种改进,所述装置还包括:笔画宽度检测模块,用于基于边缘特征点对所述候选文字区域进行笔画宽度检测;文字区域确定模块,用于根据笔画宽度确定所述候选文字区域是否是文字图像区域。作为本专利技术所述装置的又一种改进,所述装置还包括分割模块,用于根据文字图像区域的端点和角点对所述文字图像区域进行分割,得到单个文字矩形区域。为解决上述技术问题,本专利技术的有形计算机可读介质,包括用于执行本专利技术的文字区域检测方法的计算机程序代码。为解决上述技术问题,本专利技术提供一种装置,包括至少一个处理器;及至少一个存储器,含有计算机程序代码,所述至少一个存储器和所述计算机程序代码被配置为利用所述至少一个处理器使得所述装置执行本专利技术的文字区域检测方法的至少部分步骤。本专利技术针对基于边缘特征提取到的文字虚警过多以及基于联通区域检测文字效率低下而不利于对大量图像数据进行文字区域的快速准确定位的问题,提出基于LBP算子检测特征点的文字检测方法。LBP算子最重要的属性是对诸如光照变化等造成的灰度变化的鲁棒性,另外一个重要特性是它的计算简单。所以,本专利技术没有基于边缘检测那样需要大量的计算,也不会因为图像的质量而产生大量假边缘的问题。通过一组半径连续的LBP算子可以求得连续不同尺度(半径)下的特征值,通过分析得到在不同尺度下都稳定的特征点,解决了单一尺度下LBP特征不稳定的问题。此外,基于稳定的特征点实现文字区域定位,没有基于边缘定位的计算量大、虚警多的问题,提高了准确率和效率。结合附图阅读本专利技术实施方式的详细描述后,本专利技术的其它特点和优点将变得更加清楚。附图说明图1为根据本专利技术方法的一实施例的流程图。图2示出了采样点排列方式。图3示出了特征点的特征模式。图4示出了笔画横的角点的采样点分布图。图5示出了笔画横的端点的采样点分布图。图6和图7示出了笔画横的边缘的采样点分布图。图8为根据本专利技术装置的一实施例的结构示意图。为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本专利技术所必要的细节,而省略其他细节。具体实施方式下面参照附图对本专利技术的实施方式和实施例进行详细说明。通过下面给出的详细描述,本专利技术的适用范围将显而易见。然而,应当理解,在详细描述和具体例子表明本专利技术优选实施例的同时,它们仅为说明目的给出。局部二值模式(Localbinarypatterns,LBP)是一种用来描述图像局部特征的算子,它具有旋转不变性和灰度不变性的显著特点,已经广泛应用于纹理分类、纹理分割、人脸图像分析等领域。局部二值模式(LBP)首先是用来做图像局部特征比较的。传统的LBP方法通过阈值来标记中心点像素与其邻域像素之间的差别。图1示出了根据本专利技术的文字区域检测方法的一实施例的流程图。在步骤S102,对获取的待识别图像进行预处理,例如进行图像倾斜校正以校正图像、使用高斯滤波去图像的噪声等。目前倾斜校正的算法比较成熟,这里可以采用基于Hough变换的方法,求解出图像的仿射矩阵,对图像进行仿射变换。在步骤S104,将彩色图像转换为灰度图像,得到图像的亮度信息。目前彩色转灰度的算法比较成熟,这里可以采用公式:亮度值(灰度)L=0.30×R值+0.59×G值+0.11×B值进行转换。在步骤S106,构建算子序列。分别构建半径r为1、2、3本文档来自技高网
...

【技术保护点】
1.一种文字区域检测方法,其特征在于,所述方法包括:构建一组半径连续的局部二值模式LBP算子

【技术特征摘要】
1.一种文字区域检测方法,其特征在于,所述方法包括:构建一组半径连续的局部二值模式LBP算子r表示LBP算子以被检测点为圆心所覆盖的圆形区域的半径,n表示分布在所述圆形区域的圆周上的采样点个数;使用所述LBP算子检测所述图像中的稳定特征点,所述特征点包括端点、角点和边缘;基于所述特征点形成候选文字区域。2.根据权利要求1所述的方法,其特征在于,所述使用所述LBP算子检测所述图像中稳定的特征点包括:遍历图像点p,依次使用所述LBP算子中的每一LBP算子计算得到一组LBP特征值;根据所述LBP特征值确定图像点p是否为特征点。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:基于边缘特征点对所述候选文字区域进行笔画宽度检测;根据笔画宽度确定所述候选文字区域是否是文字图像区域。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:根据文字图像区域的端点和角点对所述文字图像区域进行分割,得到单个文字矩形区域。5.根据权利要求1或2所述的方法,其特征在于,所述半径r∈{1…4}像素,所述采样点数n=8、16、16、32。6.一种文字区域检测装置,其特征在于,所述装置包括:构...

【专利技术属性】
技术研发人员:奚智
申请(专利权)人:北京元心科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1