基于组件树和霍夫森林的文字检测和识别方法技术

技术编号：11729909 阅读：100 留言：0更新日期：2015-07-15 02:32

本发明专利技术公开了一种基于组件树和霍夫森林的文字检测和识别方法，首先，利用组件树提取出具有层级的连通域，同时针对文字本身的特征建立分类器，对分类器输出的正样本进行尺度统一，然后输入至霍夫森林，并以每种字符作为单独的类别，在检测过程中完成识别。对输入图像进行颜色空间转换，并对每一个颜色空间的图像及其补值进行独立处理；通过建立组件树获取具有层级的连通域；每一个连通域分别求取一组特征，并输入至分类器识别；分类器输出的正样本作为候选的文字区域，并放缩至同一尺度大小；每一个候选区域输入至霍夫森林，霍夫森林输出文字的分布概率；根据霍夫森林输出的后验概率，估计文字的位置并输出结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种计算机视觉
的文字检测和识别算法，具体为一种基于组件树和霍夫森林的文字检测和识别方法。
技术介绍
随着互联网的蓬勃发展，人们获取信息的方式发生了巨大的改变。传统媒体，如报纸、广播等，影响力逐渐让位于互联网的新兴媒体，如社交网络、轻博客等。互联网中的新兴媒体除了更新速度快、传播覆盖面广之外，同时也成为每一个用户自由发布信息的平台。每个人都可通过各类的平台，如微博等，发布消息，通过不断的转发，该消息就可能成为新的热点。图像、视频由于易于理解，符合现代人快速的生活节奏，逐渐取代文本成为主要的信息传播载体。由于微博类网站对文本长度的限制，要发表较丰富的内容通常需要图文结合的方式，同时，图片分享类网站的蓬勃发展，给图像理解领域带来新的机遇和挑战。伴随着智能手机的普及，越来越多的图像是由手机拍摄得到，而这部分图像对了解用户行为、获取用户相关信息有极大价值。这些图像拍摄的场景各式各样，可能是日常的路边，也有可能是旅途中。由于文字表达的信息相对准确，通过检测和识别场景中的文字，对图像和视频信息的提取具有重要意义。对于视频监控和基于位置的服务(LBS)等应用，通过识别图像中的文字，如招牌、标识等内容，对定位图像拍摄地点有重要的参考作用；通过检测和识别场景中的文字，还可实现实时的翻译服务。自然场景的文字检测和识别作为图像理解的重要一环，一直受到研究者的关注。一般来说，对于扫描文本，可以...

【技术保护点】
一种基于组件树和霍夫森林的文字检测和识别方法，其特征在于，包括以下步骤：步骤1：输入待检测图像，把待检测图像转换至多个颜色空间，同时求出各个颜色空间的补值；所述的补值即该颜色空间内所有像素值进行二进制取反后组成的新图像；步骤2：通过构建组件树的方式，分别提取出各个颜色空间和各个补值中具有层级的连通域，并对每一个具有层级的连通域分别执行步骤3；步骤3：对步骤2提取出的每个连通域分别进行区域特征提取，并把特征向量输入至分类器，分类器的输出结果为文字或非文字，筛选出分类结果为文字的连通域缩放至同样的大小，并执行步骤4；步骤4：每个连通域独立输入至霍夫森林，霍夫森林由一组决策树组成，霍夫森林输出文字的分布概率，然后根据输出的分布概率识别文字，并估计文字的位置。

【技术特征摘要】
1.一种基于组件树和霍夫森林的文字检测和识别方法，其特征在于，
包括以下步骤：
步骤1：输入待检测图像，把待检测图像转换至多个颜色空间，同时
求出各个颜色空间的补值；所述的补值即该颜色空间内所有像素值进行二
进制取反后组成的新图像；
步骤2：通过构建组件树的方式，分别提取出各个颜色空间和各个补
值中具有层级的连通域，并对每一个具有层级的连通域分别执行步骤3；
步骤3：对步骤2提取出的每个连通域分别进行区域特征提取，并把
特征向量输入至分类器，分类器的输出结果为文字或非文字，筛选出分类
结果为文字的连通域缩放至同样的大小，并执行步骤4；
步骤4：每个连通域独立输入至霍夫森林，霍夫森林由一组决策树组
成，霍夫森林输出文字的分布概率，然后根据输出的分布概率识别文字，
并估计文字的位置。
2.根据权利要求1所述的方法，其特征在于：步骤2所述的具有层
级的连通域，具有如下层级关系：
∀ m ∈ S ′ : ∃ n ∈ Sm ⊆ n ]]>其中，S是像素值小于等于阈值τ的连通域集合；S'是像素值小于等于阈
值υ的连通域集合，且υ<τ；m为连通域集合S'中的任一元素，n为连通域
集合S...

【专利技术属性】
技术研发人员：于慧敏，李天豪，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人