一种结合字符级分类和字符串级分类的文本检测和识别方法技术

技术编号:8656163 阅读:164 留言:0更新日期:2013-05-01 23:52
本发明专利技术公开了一种结合字符级和字符串级分类的文本检测和识别方法,在图像中提取可能属于同一字符的像素集形成备选字符;滤除不满足字符几何特征统计规律的备选字符;采用基于字符旋转和尺度不变性特征的字符级分类器对备选字符分类,以确定备选字符为某字符的概率;将字符两两合并形成初始字符串;计算两两字符串间的相似度,将相似度最高的两字符串合并成新的字符串,直到没有可再合并的字符串;采用基于字符串结构特征的字符串级分类器对字符串分类,以确认具有语意的字符串;利用待识别字符为某一字符的概率对字符串识别,得到语意文本。本发明专利技术将文本检测和识别过程作为一个整体,利用检测和识别的相互作用提高结果精度,简单高效。

【技术实现步骤摘要】

本专利技术属于计算机视觉
,更具体地,涉及。
技术介绍
在当今信息爆炸年代,运用计算机视觉技术从视觉信息(图片、视频等)中快速有效地分析和提取出有用信息变得越来越重要。文本检测和识别就是判断输入的自然场景图像中是否存在文本,如果存在,则标记其位置,然后对这些文本进行语意识别。自然图像中的文本检测和识别是计算机视觉
中重要研究课题之一,有着广泛应用,例如机器人导航、图像检索、人机交互等。在过去的几十年里,文本检测和识别技术研究取得了长足进步,其主要有两类一类是只进行文本检测或只进行文本识别;一种是将两者分开处理构成一个识别系统。但上述两类方法基本都集中在水平方向文本的检测和识别,其无法解决文本多样性问题和复杂背景问题。
技术实现思路
针对现有技术的缺陷,本专利技术的目的在于提供,该方法将文本检测和识别过程作为一个整体,利用检测和识别的相互作用提高结果精度,简单高效。一种结合字符级和字符串级分类的文本检测和识别方法,包括以下步骤(I)依据字符的组成像素中相邻像素的笔画宽度相同或相近的规律,在输入图像中提取可能属于同一字符的像素集形成备选字符;(2)滤除不满足字符几何特征统计规律的备选字符;(3)采用基于字符旋转和尺度不变性特征的字符级分类器对步骤(2)保留的备选字符进行分类,以确定备选字符是否为字符以及为某字符的字符分布概率,记被确定为字符的备选字符为待识别字符;(4)在步骤(3)确定的待识别字符中,将字符笔画宽度、尺度和颜色相同或相近以及间距小于两字符尺度之和的两字符进行合并,形成多个由两字符构成的初始字符串;计算两两字符串间的相似度,将相似度最高的两个字符串合并成一个新的字符串,重新计算合并后存在的两两字符串间的相似度,以此类推,直到没有可再合并的字符串,最终得到的字符串即为备选字符串;(5)采用基于字符串结构特征的字符串级分类器对备选字符串进行分类,以确认具有实际语意的备选字符串为待识别字符串;(6)利用步骤(3)得到的字符分布概率对待识别字符串进行识别,最终得到语意文本。进一步地,所述步骤(2)中的字符几何特征统计规律具体为字符c的宽度WV(C)变化范围为[O, I],高宽比AR(C)变化范围为,占空比OR(C)变化范围为,其中,本文档来自技高网...

【技术保护点】
一种结合字符级和字符串级分类的文本检测和识别方法,包括以下步骤:(1)依据字符的组成像素中相邻像素的笔画宽度相同或相近的规律,在输入图像中提取可能属于同一字符的像素集形成备选字符;(2)滤除不满足字符几何特征统计规律的备选字符;(3)采用基于字符旋转和尺度不变性特征的字符级分类器对步骤(2)保留的备选字符进行分类,以确定备选字符是否为字符以及为某字符的字符分布概率,记被确定为字符的备选字符为待识别字符;(4)在步骤(3)确定的待识别字符中,将字符笔画宽度、尺度和颜色相同或相近以及间距小于两字符尺度之和的两字符进行合并,形成多个由两字符构成的初始字符串;计算两两字符串间的相似度,将相似度最高的两个字符串合并成一个新的字符串,重新计算合并后存在的两两字符串间的相似度,以此类推,直到没有可再合并的字符串,最终得到的字符串即为备选字符串;(5)采用基于字符串结构特征的字符串级分类器对备选字符串进行分类,以确认具有实际语意的备选字符串为待识别字符串;(6)利用步骤(3)得到的字符分布概率对待识别字符串进行识别,最终得到语意文本。

【技术特征摘要】
1.一种结合字符级和字符串级分类的文本检测和识别方法,包括以下步骤: (O依据字符的组成像素中相邻像素的笔画宽度相同或相近的规律,在输入图像中提取可能属于同一字符的像素集形成备选字符; (2)滤除不满足字符几何特征统计规律的备选字符; (3)采用基于字符旋转和尺度不变性特征的字符级分类器对步骤(2)保留的备选字符进行分类,以确定备选字符是否为字符以及为某字符的字符分布概率,记被确定为字符的备选字符为待识别字符; (4)在步骤(3)确定的待识别字符中,将字符笔画宽度、尺度和颜色相同或相近以及间距小于两字符尺度之和的两字符进行合并,形成多个由两字符构成的初始字符串;计算两两字符串间的相似度,将相似度最高的两个字符串合并成一个新的字符串,重新计算合并后存在的两两字符串间的相似度,以此类推,直到没有可再合并的字符串,最终得到的字符串即为备选字符串; (5)采用基于字符串结构特征的字符串级分类器对备选字符串进行分类,以确认具有实际语意的备选字符串为待识别字符串; (6)利用步骤(3)得到的字符分布概率对待识别字符串进行识别,最终得到语意文本。2.根据权利要求1所述的文本检测和识别方法,其特征在于,所述步骤(2)中的字符几何特征统计规律具体为:字符c的宽度WV(C)变化范围为[O,1],高宽比AR(C)变化范围为,占空比OR(C)变化范围为,其中,3.根据权利要求1所述的文本检测和识别方法,其特征在于,所述步骤(3)中基于字符旋转和尺度不变性特征的字符级分类器构建方法具体为: (31)提取训练样本字符c的基本信息,包括重心0(c)、长轴L(C)、...

【专利技术属性】
技术研发人员:白翔姚聪蔡超刘文予
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1