一种基于自学习色彩聚类的自然场景文本检测的方法技术

技术编号：15691498 阅读：100 留言：0更新日期：2017-06-24 04:45

本发明专利技术提供了一种基于自学习色彩聚类的自然场景文本检测的方法，首先，将层次聚类和参数自学习策略结合，设计一种自适应色彩聚类方法，提取图像中的候选字符，该自适应色彩聚类方法能针对不同图像自动学习权重阈值，有较好的字符召回率。然后，通过训练Adaboost分类器，构建字符验证模型，移除非文本字符；最后，合并字符构建文本行，并通过后处理得到文本检测结果。与传统的方法相比，本方法能获得较高的文本检测召回率，且检测的文本结果较为准确。

A method of text detection in natural scenes based on self-learning color clustering

The present invention provides a method of natural scene text detection self-learning color clustering based on first, the hierarchical clustering and parameter self-learning strategy combination, design an adaptive color clustering method, candidate characters are extracted from the image, the adaptive color clustering method for weight threshold automatic learning of different images, good character recall. Then, the Adaboost classifier is trained to construct the character verification model to remove the non text characters. Finally, the merged characters are used to construct the text lines, and the text detection results are obtained by post-processing. Compared with the traditional methods, this method can achieve higher recall rate of text detection, and the results of text detection are more accurate.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自学习色彩聚类的自然场景文本检测的方法
本专利技术属于模式识别
，涉及一种基于自学习色彩聚类的自然场景文本检测方法。
技术介绍
自然场景图像文本包含大量有效信息，提取图像文本是图像内容分析和理解的重要前提，并可广泛应用于车牌检测、无人驾驶、基于内容的图像检索、手机文本识别和机器人自动导航等领域。然而，由于自然场景图像文本检测方法受到多方面的因素影响，增加了文本检测的难度，其中影响因素主要分为以下三类：复杂的图像背景：图像采集于任意的场景，不同图像中色彩复杂程度各异，且存在大量的树叶、砖头、栏杆和瓦片等干扰物体，易导致文本检测错误。多样化的文本：自然场景图像中文本尺寸大小和样式的多样化，且文本字符存在不同程度的扭曲和倾斜。不同程度的干扰因素：自然场景图像为户外拍摄采集得到，易受不同程度的光照、阴影、分辨率和拍摄角度的影响。为克服上述影响因素，提高文本检测的准确率，专家学者提出了大量的自然场景文本检测方法，主要分为两类：基于滑动窗口的方法和基于连通域的方法。基于滑动窗口的文本检测方法通常使用多尺度滑动窗口，扫描原始图像，提取候选文本区域，然后结合候选区域...
一种基于自学习色彩聚类的自然场景文本检测的方法

【技术保护点】
一种基于自学习色彩聚类的自然场景文本检测方法，其特征在于，包括以下步骤：步骤1：将待进行文本检测图像I中的每个像素点的R、G、B色彩值投影到三维色彩空间中，对三维色彩空间进行等间距划分，每个三维色彩空间立方体作为一个层次聚类基本单元；以每个三维色彩空间立方体中所有像素点的色彩均值作为层次聚类基本单元的特征c；步骤2：初始化层次聚类基本单元的特征权重向量w，w＝(w

【技术特征摘要】
1.一种基于自学习色彩聚类的自然场景文本检测方法，其特征在于，包括以下步骤：步骤1：将待进行文本检测图像I中的每个像素点的R、G、B色彩值投影到三维色彩空间中，对三维色彩空间进行等间距划分，每个三维色彩空间立方体作为一个层次聚类基本单元；以每个三维色彩空间立方体中所有像素点的色彩均值作为层次聚类基本单元的特征c；步骤2：初始化层次聚类基本单元的特征权重向量w，w＝(wr,wg,wb,wθ)；其中，wr，wg，wb分别为层次聚类基本单元像素点的R、G、B的色彩距离权重，wθ为聚类阈值；步骤3：以层次聚类基本单元的特征权重向量，依次计算任意两个层次聚类基本单元之间的颜色距离；步骤4：将颜色距离最小的两个层次聚类基本单元进行合并，获得新的层次聚类基本单元，并计算新的层次聚类基本单元的特征c，以层次聚类基本单元合并构建对应的层次聚类树，返回步骤3，直到层次聚类基本单元数量为1；步骤5：构建正样本和负样本的特征向量；依据聚类阈值wθ，对步骤4中构建的层次聚类树进行划分，得到层次聚类森林，以层次聚类森林中同一棵子树下的任意两个初始的层次聚类基本单元的颜色距离作为正样本的特征向量，以层次聚类森林中不同子树下的任意两个初始的层次聚类基本单元的颜色距离作为负样本的特征向量；步骤6：利用层次聚类基本单元的特征权重向量w的当前取值，并采用激活函数对步骤5构建的正样本和负样本的特征向量进行样本类别预测，并利用样本类别预测值和样本本身的类别属性，构建权重向量w的似然函数，通过最大化似然函数求得新的层次聚类基本单元的特征权重向量w，若更新后的w使得构建的似然函数的最大值收敛，则以新的层次聚类基本单元的特征权重向量w，重新构建层次聚类森林，否则，返回步骤3；步骤7：依次以步骤6获得的层次聚类森林中每一颗子树包含的所有初始层次聚类单元中像素点进行合并，构建对应的色彩层；步骤8：从每个色彩层中提取连通域，得到候选字符，用分类器对候选字符进行筛选，对经过筛选后的候选字符进行字符合并，得到文本行；对文本行进行单词划分，得到文本检测结果。2.根据权利要求1所述的方法，其特征在于，所述步骤6中采用的激活函数为逻辑回归函数：其中，hw(x)为输入向量x对应样本的预测结果；x为输入向量，由正样本或负样本的特征向量和截距项-1组成，x＝(|μi(r)-μj(r)|,|μi(g)-μj(g)|,|μi(b)-μj(b)|,-1)。3.根据权利要求2所述的方法，其特征在于，所述步骤6中构建的权重向量w的似然函数如下：

【专利技术属性】
技术研发人员：郭建京，邹北骥，吴慧，杨文君，徐子雯，
申请(专利权)人：中南大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人