当前位置: 首页 > 专利查询>清华大学专利>正文

基于监督流形学习的场景分类方法及装置制造方法及图纸

技术编号:6879892 阅读:254 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于监督流形学习的场景分类方法及装置。基于监督流形学习的场景分类方法包括以下步骤:输入人工标注了场景类别的N个训练图像,其中场景类别为C个;提取N个训练图像的S个SIFT特征并获取由S个SIFT特征的M个聚类中心组成的码本;对于每个场景类别,将SIFT特征和码字作为节点,建立有监督的谱图G=(V,E)并获取与V对应的权重矩阵;获取每个流形结构上的各个SIFT特征到M个码字的度量;输入新的训练图像或测试图像;获取新的训练图像或测试图像上的SIFT特征到M个码字的度量;计算新的训练图像或测试图像上的SIFT特征到M个码字的隶属度并得到C个直方图向量;以及利用支持向量机对C个直方图向量进行学习,得到每个场景类别的判断模型。

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域,特别涉及一种基于监督流形学习的场景分类方法及直O
技术介绍
场景分类时利用机器学习方法,得到图片所代表的场景类别。它在场景识别中有非常重要的作用。场景识别的应用领域主要在为遥感图像解释、目标识别和理解、基于内容和图像和视频检索。现有场景分类做法是,对于每一幅图片,提取出一个向量(也就是l*n的数组)来表示它。然后把训练图片的向量和其类别送入SVM(支持向量机)进行训练,得到每个场景类别的分类器。对于测试图像,也提取出相应的向量,根据训练得到的分类器获得它的场景类别。但是传统的软分配、硬分配算法,都没有考虑高维图像特征点的流形特征。流形计算的效率很差,而且如何建立数据的流形结构也是一个问题。采用谱图分配的方法可以显著的提高算法的准确度,但是,谱图算法需要对拉普拉斯矩阵求逆,使得算法的效率不如传统的线性分配方法。并且统计图像的直方图向量较短,识别率较差。
技术实现思路
本专利技术的目的旨在至少解决上述技术缺陷之一。为此,本专利技术需要提供一种基于监督流形学习的场景分类方法及装置,该基于监督流形学习的场景分类方法及装置的优点是提高了基于谱图分析的码字分配算法的效率,得到了较长的图片直方图向量结果并提高了算法的准确度。根据本专利技术的一方面,提供了一种基于监督流形学习的场景分类方法,其特征在于,包括以下步骤1)输入人工标注了场景类别的N个训练图像,其中场景类别为C个,N 是大于等于1的整数;2)提取所述N个训练图像的S个SIFT特征并获取由所述S个SIFT 特征的M个聚类中心组成的码本,其中每个聚类中心是一个码字,其中S是大于等于N的整数;3)对于每个场景类别,将SIFT特征和码字作为节点,建立有监督的谱图G = (V,E)并获取与V对应的权重矩阵W,所述权重矩阵W用于表示与每个场景类别对应的流形结构,V是谱图中所有节点的集合,E是节点间相邻边的集合;4)获取每个流形结构上的各个SIFT特征到所述M个码字的度量;5)输入新的训练图像或测试图像;6)获取所述新的训练图像或测试图像上的SIFT特征在C个流形结构上到所述M个码字的度量;7)计算所述新的训练图像或测试图像上的SIFT特征到所述M个码字的隶属度并得到C个直方图向量;以及8) 利用支持向量机对所述C个直方图向量进行学习,得到每个场景类别的判断模型。根据本专利技术实施例的基于监督流形学习的场景分类方法,可以提高基于谱图分析的码字分配算法的效率并提高算法的准确度。根据本专利技术的一个实施例,在所述步骤2~)中利用K-means算法将所述S个SIFT 特征聚类。根据本专利技术的一个实施例,步骤幻包括以下步骤31)计算两两节点之间的欧式距离;32)根据计算的距离,找到每一个节点的K近邻;33)构建与每个节点对应的权重矩阵W,用于表示节点之间的关系,所述权重矩阵W表达如下ΤΓ _ k 丨和j为近邻节点。k 其它情况根据本专利技术的一个实施例,步骤4)包括使用测地距离或者扩散图获取每个流形结构上的各个SIFT特征到所述M个码字的度量,其中度量越小则相似程度越大,度量越大则相似程度越小。根据本专利技术的一个实施例,所述步骤6)包括对于所述新的训练图像或测试图像上的每个SIFT特征,在每个流形结构上,找到离所述每个SIFT特征最近的SIFT特征,利用所述最近的SIFT特征到所述M个码字的度量,进行线性插值,从而得到所述每个SIFT特征到所述M个码字的度量。根据本专利技术实施例所述的监督流形学习的场景分类方法,可以提高算法的效率。根据本专利技术的一个实施例,所述步骤7)包括对所述度量利用负指数函数进行惩罚,得到相应的隶属度。根据本专利技术的一个实施例,所述步骤7)包括根据预定顺序把所述C个直方图向量拼接起来,所述步骤8)包括利用支持向量机对拼接起来的C个直方图向量进行学习,得到每个场景类别的判断模型。根据本专利技术实施例所述的监督流形学习的场景分类方法,可以加长直方图向量,增加识别率。根据本专利技术的另一方面,提供了一种基于监督流形学习的场景分类装置,包括输入模块,所述输入模块用于输入人工标注了场景类别的N个训练图像,其中场景类别为C 个,所述输入模块还用于输入新的训练图像或测试图像,其中N是大于等于1的整数;码本获取模块,所述码本获取模块用于提取所述N个训练图像的S个SIFT特征并获取由所述S 个SIFT特征的M个聚类中心组成的码本,其中每个聚类中心是一个码字,其中S是大于等于N的整数;权重矩阵构建模块,对于每个场景类别,所述矩阵构建模块用于将SIFT特征和码字作为节点,建立有监督的谱图G= (V,E)并获取与V对应的权重矩阵W,所述权重矩阵 W用于表示与每个场景类别对应的流形结构,V是谱图中所有节点的集合,E是节点间相邻边的集合;度量获取模块,所述度量获取模块用于获取每个流形结构上的各个SIFT特征到所述M个码字的度量;隶属度计算模块,所述隶属度计算模块计算所述新的训练图像或测试图像上的SIFT特征到所述M个码字的隶属度并得到C个直方图向量;以及判断模型获取模块,所述判断模型获取模块利用支持向量机对所述C个直方图向量进行学习,得到每个场景类别的判断模型。根据本专利技术实施例的基于监督流形学习的场景分类装置,可以提高基于谱图分析的码字分配算法的效率并提高算法的准确度。根据本专利技术的一个实施例,所述码本获取模块利用K-means算法将所述S个SIFT 特征聚类。根据本专利技术的一个实施例,所述矩阵构建模块进一步用于计算两两节点之间的欧式距离;根据计算的距离,找到每一个节点的K近邻;构建与每个节点对应的权重矩阵W,用于表示节点之间的关系,所述权重矩阵W表达如下本文档来自技高网...

【技术保护点】
1.一种基于监督流形学习的场景分类方法,其特征在于,包括以下步骤:1)输入人工标注了场景类别的N个训练图像,其中场景类别为C个,N是大于等于1的整数;2)提取所述N个训练图像的S个SIFT特征并获取由所述S个SIFT特征的M个聚类中心组成的码本,其中每个聚类中心是一个码字,其中S是大于等于N的整数;3)对于每个场景类别,将SIFT特征和码字作为节点,建立有监督的谱图G=(V,E)并获取与V对应的权重矩阵W,所述权重矩阵W用于表示与每个场景类别对应的流形结构,V是谱图中所有节点的集合,E是节点间相邻边的集合;4)获取每个流形结构上的各个SIFT特征到所述M个码字的度量;5)输入新的训练图像或测试图像;6)获取所述新的训练图像或测试图像上的SIFT特征在C个流形结构上到所述M个码字的度量;7)计算所述新的训练图像或测试图像上的SIFT特征到所述M个码字的隶属度并得到C个直方图向量;以及8)利用支持向量机对所述C个直方图向量进行学习,得到每个场景类别的判断模型。

【技术特征摘要】
1.一种基于监督流形学习的场景分类方法,其特征在于,包括以下步骤1)输入人工标注了场景类别的N个训练图像,其中场景类别为C个,N是大于等于1的整数;2)提取所述N个训练图像的S个SIFT特征并获取由所述S个SIFT特征的M个聚类中心组成的码本,其中每个聚类中心是一个码字,其中S是大于等于N的整数;3)对于每个场景类别,将SIFT特征和码字作为节点,建立有监督的谱图G= (V, E)并获取与V对应的权重矩阵W,所述权重矩阵W用于表示与每个场景类别对应的流形结构,V 是谱图中所有节点的集合,E是节点间相邻边的集合;4)获取每个流形结构上的各个SIFT特征到所述M个码字的度量;5)输入新的训练图像或测试图像;6)获取所述新的训练图像或测试图像上的SIFT特征在C个流形结构上到所述M个码字的度量;7)计算所述新的训练图像或测试图像上的SIFT特征到所述M个码字的隶属度并得到 C个直方图向量;以及8)利用支持向量机对所述C个直方图向量进行学习,得到每个场景类别的判断模型。2.根据权利要求1所述的基于监督流形学习的场景分类方法,其特征在于,在所述步骤2)中利用K-means算法将所述S个SIFT特征聚类。3.根据权利要求1所述的基于监督流形学习的场景分类方法,其特征在于,步骤3)包括以下步骤31)计算两两节点之间的欧式距离;32)根据计算的距离,找到每一个节点的K近邻;33)构建与每个节点对应的权重矩阵W,用于表示节点之间的关系,所述权重矩阵W表达如下4.根据权利要求1所述的基于监督流形学习的场景分类方法,其特征在于,步骤4)包括使用测地距离或者扩散图获取每个流形结构上的各个SIFT特征到所述M个码字的度量,其中度量越小则相似程度越大,度量越大则相似程度越小。5.根据权利要求4所述的基于监督流形学习的场景分类方法,其特征在于,所述步骤6)包括对于所述新的训练图像或测试图像上的每个SIFT特征,在每个流形结构上,找到离所述每个SIFT特征最近的SIFT特征,利用所述最近的SIFT特征到所述M个码字的度量, 进行线性插值,从而得到所述每个SIFT特征到所述M个码字的度量。6.根据权利要求1所述的基于监督流形学习的场景分类方法,其特征在于,所述步骤7)包括对所述度量利用负指数函数进行惩罚,得到相应的隶属度。7.根据权利要求1所述的基于监督流形学习的场景分类方法,其特征在于,所述步骤 7)包括根据预定顺序把所述C个直方图向量拼接起来,所述步骤8)包括利用支持向量机对拼接起来的C个直方图向量进行学习,得到每个场景类别的判断模型。8.一种基于监督流形学习的场景分类装置,其特征在于,包括输入模块,所述输入模块...

【专利技术属性】
技术研发人员:戴琼海钱彦君刘烨斌
申请(专利权)人:清华大学
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1