一种确定特征的级联分类器的连接顺序和特征阈值的方法技术

技术编号:2942268 阅读:360 留言:0更新日期:2012-04-11 18:40
本发明专利技术提出了一种确定一组不同特征的级联分类器的连接顺序和特征阈值的方法。该级联分类器组用于从由图像分解而得的候选连通分量中提取要选定的连通分量。该方法包括以下步骤:首先通过分解至少一幅图像而获得多个连通分量作为当前样例,再将当前样例并行送入当前各个特征的级联分类器中,进行循环训练,从而确定各个不同特征的级联分类器的连接顺序以及特征阈值区间。本发明专利技术还提出了一种从图像中获取要选定的图像的方法,利用根据前述方法级联起来的分类器组,能够快速去除非选定的连通分量,而将更多时间花费在计算可能是选定的连通分量上,既提高了图像处理速度,又提高了获取图像的精度。

【技术实现步骤摘要】

本分明涉及一种数字图像处理领域,尤其涉及,以及利用由该方法形成的级联分类器组从图像中获取选定的图像的方法。
技术介绍
自然场景中的文本检测和分割有很多应用。随着高性能、低价格、便携式数码影像设备的增加,场景文本识别的应用急速扩展。通过使用和手机、PDA或其他专用数码设备相连的摄像机,我们能轻易地捕取身边的文本例如路名、广告、交通警告、饭店菜单等等。对这些文本的自动识别、翻译和发音能够对海外游客、视觉障碍人士和视频检索程序、会议处理等起到很大的帮助。从图像特别是自然场景图像中全自动地提取文本,始终是一个具有挑战性的问题。其难点包括字符的字体、大小、复杂背景、非均匀光照、阴影和图像噪声等。而且,对图像处理速度的要求也越来越高。近年来,针对自然场景图像中文本获取的工作有了较快的发展。目前有两类从自然场景图像中获取文本的方法。第一类是基于纹理的方法。Shin等人在2000年发表的《基于支持向量机的数字视频文本检测》中使用星型像素模板来揭示文本的内在特征。在2000年9月发表的《使用局部化度量方法获取文本区域》中,P.Clark等人仔细地提出了5种局部化的度量方法,并将这些度量组合来求得候选文本区域。频域方法也被用于检测类似文本的纹理,例如短扫描行的傅立叶变换,离散余弦变换,Gabor变换,小波分解,多分辨率边缘检测。我们发现对于相对较小的字符,如菜单或文档中的文本行,这些方法效果良好,因为小文本通常拥有强纹理响应。然而,对于大字符,例如路旁或店名,对于复杂背景的强纹理响应会误导这些算法,从而留下很多大字符没有被发现。第二类方法是基于连通分量(Connected-Component,CC)的方法。彩色量化,数学形态学操作和对称邻域滤波通常被用于将原始图像分解为候选连通分量。这些算法能有效地处理大字符和小字符。但如何从候选连通分量中提取文本连通分量,人们往往使用启发式的方法,例如长宽比,对齐与合并分析,布局分析,多层连通分量分析。这类方法的缺点在于,所有启发式的规则是固定的顺序,而且其阈值是手动输入的经验值,通常不稳定,不能保证得到鲁棒的检测结果。另外,还可以用一种强分类器(例如支持向量机,SupportVector Machine,SVM)从候选连通分量中提取文本连通分量,这类方法的缺点是对每个连通分量必须计算其全部特征,计算量和耗费的时间都太大了。本专利技术受到人脸检测技术的启发,利用级联分类器组从候选连通分量中提取要选定的连通分量(例如,文本连通分量),在提高图像处理速度的同时能获得很高的检测率。
技术实现思路
本专利技术的目的之一在于提出一种确定一组不同特征(F1,F2,...,FM)的级联分类器(h1,h2,...,hM)的连接顺序和特征阈值的方法。该级联分类器组用于从由图像分解而得的候选连通分量中提取要选定的连通分量,这里的不同特征与要选定的图像相关,该方法包括以下步骤a.通过分解至少一幅图像而获得多个连通分量作为当前样例,并将M个不同特征的级联分类器作为当前各个特征的级联分类器,所述当前样例包括正例集合P和反例集合N,所述正例是要选定的连通分量,所述反例是非选定的连通分量;b.将当前样例并行送入当前各个特征的级联分类器中,进行i次循环训练中的一次训练,其中i为0<i≤M的正整数,依次选取参与每次训练的当前所有特征中最大虚警率对应的特征,由此确定各个不同特征的级联分类器的连接顺序,其中所述虚警率为每次训练中被级联分类器误认为要选定的连通分量而实际为非选定的连通分量的数量与当前反例数量之比;c.每次选取特征后,再将当前样例送入此次选取的特征对应的级联分类器中进行训练,在此训练过程中,虚警率和检测率都不断变化,并根据该特征被允许的最小检测率获取所述特征的阈值区间,由此确定各个不同特征的级联分类器的特征阈值区间;所述检测率为一个级联分类器正确检测出的选定连通分量的数量与正例数量之比;以及d.在执行步骤b和c之后,删除步骤b中被选取的特征和该特征的分类器以更新当前特征和当前各个特征的分类器,并且将该次训练中的正例集合保持不变以及将步骤c中获得特征的阈值区间时被级联分类器误认为要选定的连通分量而实际为非选定的连通分量作为新的反例集合来更新当前样例,用于下次循环训练。上述步骤a中将图像分解为连通分量进一步包括以下步骤a1.用非线性Niblack阈值化方法处理所述图像;和a2.将所述处理后的图像分解为连通分量。其中,非线性Niblack阈值化方法在标准Niblack方法的背景滤波器和前景滤波器中各增加了一个统计顺序滤波器。本专利技术的另一目的在于提供一种从图像中获取要选定的图像的方法,包括以下步骤A.将图像分解为连通分量;B.将该连通分量送入根据前述方法所级联起来的一组不同特征的级联分类器的第一级,该特征与要选定的图像相关,每一个级联分类器丢弃非选定连通分量,并向下一级分类器输出要选定的连通分量;以及C.将级联分类器组中最后一级分类器输出的要选定的连通分量组合形成要选定的图像。本专利技术的又一目的在于提供一种从图像中获取要选定的图像的装置,该装置包括分解装置,用于将图像分解为连通分量;根据前述方法级联起来的一组不同特征的级联分类器,将该连通分量输入该级联分类器的第一级,每一个级联分类器丢弃非选定的连通分量,并向下一级分类器输出要选定的连通分量;以及图像合成装置,用于将级联分类器组中最后一级分类器输出的要选定的连通分量组合形成要选定的图像。由于本专利技术方法使用了新的非线性Niblack方法来处理原始图像,可以高效地将灰度图像分解为多个候选连通分量,提高了连通分量的质量。另外,上述方法训练成的级联分类器组能够容易地去除大多数非文本连通分量,并快速关注认为可能是文本的连通分量。这样,既降低了本方法的计算量,提高了图像处理速度,又能得到很高的检测率。附图简要说明附图说明图1是根据本专利技术一个实施例的确定一组不同特征的级联分类器的连接顺序和特征阈值的方法的流程图; 图2是根据本专利技术第二实施例的从图像中获取文本图像的方法的流程图;以及图3是根据本专利技术第三实施例的从图像中获取文本图像的装置图。具体实施例方式下面将结合附图和具体实施方式对本专利技术作进一步的详细描述。如前述提到的,本专利技术方法受到人脸检测技术的启发,利用级联分类器组从候选连通分量中提取文本连通分量,候选连通分量通过分解原始图像而得到,原始图像可以是自然场景图像。将文本连通分量组合起来形成文本图像,这样,我们就可以从自然场景图像中获取文本图像了。那么,上述的级联分类器组怎样才能从候选连通分量中提取文本连通分量呢?首先,我们提出了12种不同的特征,这12种特征能够有效地区分文本或非文本连通分量。再将这12个特征对应级联分类器组中的每个分类器,并且对该级联分类器组进行训练,以确定这组不同特征的级联分类器的连接顺序和特征阈值。这样级联起来的级联分类器组能够快速地丢弃非文本连通分量,输出文本连通分量。接下来先具体描述揭示文本连通分量的内在本质特性的12种特征,包括几何特征,边缘对比度特征,形状正则特征,笔划特征以及空间一致性特征。1.几何特征几何特征包括面积比率(Area Ratio),长度比率(Length Ratio)和长宽比(Aspect Ratio)。它们能够很有效地排除大量本文档来自技高网
...

【技术保护点】
一种确定一组不同特征(F↓[1],F↓[2],…,F↓[M])的级联分类器(h↓[1],h↓[2],…,h↓[M])的连接顺序和特征阈值的方法,所述方法形成的级联分类器组用于从图像中获取要选定的图像,所述不同特征与要选定的图像相关,其中,M为≥1的正整数,其特征在于,包括以下步骤:a.通过分解至少一幅图像而获得多个连通分量作为当前样例,并将M个不同特征的级联分类器作为当前各个特征的级联分类器,所述当前样例包括正例集合P和反例集合N,所述正例是标注为要选定的连通分量,所 述反例是标注为非选定的连通分量;b.将当前样例并行送入当前各个特征的级联分类器中,进行i次循环训练中的一次训练,其中i为0<i≤M的正整数,依次选取参与每次训练的当前所有特征中最大虚警率对应的特征,由此确定各个不同特征的级联分类器的 连接顺序,其中所述虚警率为每次训练中被级联分类器误认为要选定的连通分量而实际为非选定的连通分量的数量与当前反例数量之比;c.每次选取特征后,再将当前样例送入此次选取的特征对应的级联分类器中进行训练,在此训练过程中,虚警率和检测率都不 断变化,并根据该特征被允许的最小检测率获取所述特征的阈值区间,由此确定各个不同特征的级联分类器的特征阈值区间;所述检测率为一个级联分类器正确检测出的选定连通分量的数量与正例数量之比;以及d.在执行步骤b和c之后,删除步骤b中被选取的 特征和该特征的分类器以更新当前特征和当前各个特征的分类器,并且将该次训练中的正例集合保持不变以及将步骤c中获得特征的阈值区间时被级联分类器误认为要选定的连通分量而实际为非选定的连通分量作为新的反例集合来更新当前样例,用于下次循环训练。...

【技术特征摘要】

【专利技术属性】
技术研发人员:戚飞虎朱凯华蒋人杰徐立相泽知祯
申请(专利权)人:欧姆龙株式会社上海交通大学
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1