一种基于可伸缩表示学习的图像分类方法技术

技术编号:28376125 阅读:14 留言:0更新日期:2021-05-08 00:03
本发明专利技术公开了一种基于可伸缩表示学习的图像分类方法,包括以下步骤:将图像表示为具有固定分辨率的矢量,获取图像集的特征矩阵M;将所述的特征矩阵输入到可伸缩表示学习过程中,获得低维目标矩阵;采用所述低维目标矩阵表示的训练集对KNN分类器进行训练;利用训练好的KNN分类器用于对待分类图像进行分类。本发明专利技术方法设计了可伸缩表示学习方法,该方法保留了数据的相似关系,可扩展且易于并行化,适用于大规模图像分类应用,实验表明,在大规模图像分类问题中本发明专利技术方法优于当前最好的矩阵表示学习方法。

【技术实现步骤摘要】
一种基于可伸缩表示学习的图像分类方法
本专利技术属于图像处理及识别领域,具体涉及一种基于可伸缩表示学习的图像分类方法。
技术介绍
在图像分类的机器学习和数据挖掘应用中,输入数据始终由冗余特征或噪声组成,这会对机器学习和数据挖掘方法的泛化能力产生负面影响。结果,许多实际的工作不得不用在数据预处理和数据转换过程方面,以将机器学习和数据挖掘有效地应用于实际问题中。众所周知,特征工程非常重要,但是需要大量的人工,这突出了从许多机器学习算法的数据中提取和组织区分性信息的弱点。为了解决该问题并提高数据质量,减轻维度问题的困扰并进一步减少存储量,开发数据表示学习方法非常重要。通常,在进行图像分类的机器学习任务有三种表示数据的学习方法:特征选择,降维和嵌入式表示表示学习。(1)特征选择涉及从所有可用变量中选择最佳变量集。典型的特征选择方法包括Relief,LasVegasWrapper等方法,其特征的种类严格限制功能的可用表示形式。(2)降维研究如何在保留最重要信息的同时缩小数据大小,有许多经典的线性和非线性降维算法,例如PCA(主成分分析),LLE(局部线性嵌入),SVD(奇异值分解)和LE(拉普拉斯特征图谱)。尽管这些方法在没有指定数据域的情况下适用于矩阵的低维表示,但是它们具有很高的计算和存储复杂性,并且难以应用于大规模数据的表示学习。例如,LLE和LE的计算复杂度均为O(n2)(与数据点的数量成正比)。(3)嵌入式表示学习旨在利用神经网络学习数据的信息表示。特别是,嵌入表示学习已在NLP网络和知识图等不同领域得到了广泛的研究。这种方法的计算效率很高,并且计算复杂度大多为O(|E|)甚至O(n),其中E是图或网络的边缘集。但是它们是在域中指定的,不能通用地适应矩阵的低维数据表示。但是嵌入式表示学习的方法一般是在指定域中使用,在图像分类应用中难以通用地适应矩阵的低维数据表示。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种基于可伸缩表示学习的图像分类方法,所述方法克服现有技术的不足,用于对图像数据集中的图像进行快速高效地分类,本专利技术方法使用神经网络进行数据表示,它既可以利用嵌入表示学习方法高效计算的优势,又可以利用降维方法可以不使用指定数据域而适应常规数据表示学习的特点。基于上述目的,一种基于可伸缩表示学习的图像分类方法,包括以下步骤:步骤1,将图像表示为具有固定分辨率的矢量,获取图像集的特征矩阵M;步骤2,将所述的特征矩阵输入到可伸缩表示学习过程中,获得低维目标矩阵;步骤3,采用所述低维目标矩阵表示的训练集对KNN(k-NearestNeighbor)分类器进行训练;步骤4,利用训练好的KNN分类器用于对待分类图像进行分类。所述的步骤2中所述的可伸缩表示学习过程包括以下步骤:步骤201,根据所述的特征矩阵M中的向量成对相似性,构建邻接图G,特征矩阵中的向量构成邻接图的节点;步骤202,在邻接图G中利用加权随机游走模型生成邻接图中节点的上下文;步骤203,通过扩展skip-gram模型来学习嵌入表示,获得嵌入式表示的低维目标矩阵。具体地,在步骤201中,邻接图G中每一个节点代表特征矩阵中的一个向量,计算节点之间的相似性,若两节点中一个节点是另一个节点的前k个相似性节点,则该两节点直接通过边连接;在步骤202中,所述的加权随机游走模型是一种在邻接图上生成随机序列的方法,假如(xw1,xw2,…,xwl)是一个长度为l的随机序列,采用一个大小为c的滑动窗口来表示一个节点的上下文,随机序列中节点xwj的上下文NC(xwj)可以表示为:NC(xwj)={xwm|-c≤m-j≤c,m∈(1,2,…,l)},在邻接图中,给定前一个节点xw(t-1)=vb,采用下面公式计算当前节点是va的概率:其中,E是邻接图的边集,P表示条件概率,sim()表示两个节点之间的相似度,是一个归一化常数;在步骤203中,所述的扩展skip-gram模型中用于学习嵌入表示的目标函数为:其中,f表示所要计算得到的目标函数,其实现将当前的高维数据表示为低维数据,但是仍然保持降维表示后数据之间的相似度信息,NC(xi)表示为xi的上下文,exp()表示以e为底的指数函数。进一步地,在步骤203中使用负采样方法对进行近似快速计算,利用gensim工具包实施负采样,并将采样阈值设置为0.001,使用随机梯度下降优化所述的目标函数,并以此学习获得函数f。更进一步地,在步骤201中采用余弦相似性度量节点之间的相似性。附图说明图1为本专利技术实施例的整体流程示意图。图2为本专利技术实施例的可伸缩表示学习过程示意图。具体实施方式下面结合附图对本专利技术作进一步的说明,但不以任何方式对本专利技术加以限制,基于本专利技术教导所作的任何变换或替换,均属于本专利技术的保护范围。如图1所示,一种基于可伸缩表示学习的图像分类方法,包括以下步骤:步骤1,将图像表示为具有固定分辨率的矢量,获取图像集的特征矩阵M;步骤2,将所述的特征矩阵输入到可伸缩表示学习过程中,获得低维目标矩阵;步骤3,采用所述低维目标矩阵表示的训练集对KNN分类器进行训练;步骤4,利用训练好的KNN分类器用于对待分类图像进行分类。如图2所示,所述的步骤2中所述的可伸缩表示学习过程包括以下步骤:步骤201,根据所述的特征矩阵M中的向量成对相似性,构建邻接图G,特征矩阵中的向量构成邻接图的节点;步骤202,在邻接图G中利用加权随机游走模型生成邻接图中节点的上下文;步骤203,通过扩展skip-gram模型来学习嵌入表示,获得嵌入式表示的低维目标矩阵。步骤2的目的是通过函数f来学习矩阵Mn×D到目标矩阵Zn×d∈Rn×d的表示,并将最重要的信息保留在原始数据集中。形式上,可以使用以下等式来表示问题。Zn×d=f(Mn×D,sim())在等式中,每个向量xi∈M(xi∈RD)被表示为d维向量(d<<D),并且M中的向量数量不变。为了定义学习函数f,专利技术中必须考虑要捕获或保留的数据的哪些属性。上述等式中,sim()是定义用于捕获和保留数据属性的相似度性函数。在构建邻接图的过程中,考虑矩阵M中存在矢量,希望保持矢量的成对相似关系,故用加权邻接图G代表矩阵M,矩阵中的向量是图的节点。然后,将学习矩阵表示并保持向量相似性的问题转移到学习加权图的表示,并保留邻接图中节点的邻域。对于矩阵M中向量的top-k相似向量,则存在连接图G中对应节点的边,如果vi是vj的top-k最近邻居之一或vj是vi的top-k最近邻居之一,则节点vi和vj通过一条边连接。为了计算两个节点之间的成对相似度,可以使用许多常用的全局和局部相似度/距离函数,例如Jaccard,余弦,骰子和集合和向量的重叠相似度,在本实施例的实验中,选择局部相似度函数“余弦相似性”以保留M中向量的成对相似度关本文档来自技高网
...

【技术保护点】
1.一种基于可伸缩表示学习的图像分类方法,其特征在于,包括以下步骤:/n步骤1,将图像表示为具有固定分辨率的矢量,获取图像集的特征矩阵M;/n步骤2,将所述的特征矩阵输入到可伸缩表示学习过程中,获得低维目标矩阵;/n步骤3,采用所述低维目标矩阵表示的训练集对KNN分类器进行训练;/n步骤4,利用训练好的KNN分类器用于对待分类图像进行分类;/n所述的步骤2中所述的可伸缩表示学习过程包括以下步骤:/n步骤201,根据所述的特征矩阵M中的向量成对相似性,构建邻接图G,特征矩阵中的向量构成邻接图的节点;/n步骤202,在邻接图G中利用加权随机游走模型生成邻接图中节点的上下文;/n步骤203,通过扩展skip-gram模型来学习嵌入表示,获得嵌入式表示的低维目标矩阵。/n

【技术特征摘要】
1.一种基于可伸缩表示学习的图像分类方法,其特征在于,包括以下步骤:
步骤1,将图像表示为具有固定分辨率的矢量,获取图像集的特征矩阵M;
步骤2,将所述的特征矩阵输入到可伸缩表示学习过程中,获得低维目标矩阵;
步骤3,采用所述低维目标矩阵表示的训练集对KNN分类器进行训练;
步骤4,利用训练好的KNN分类器用于对待分类图像进行分类;
所述的步骤2中所述的可伸缩表示学习过程包括以下步骤:
步骤201,根据所述的特征矩阵M中的向量成对相似性,构建邻接图G,特征矩阵中的向量构成邻接图的节点;
步骤202,在邻接图G中利用加权随机游走模型生成邻接图中节点的上下文;
步骤203,通过扩展skip-gram模型来学习嵌入表示,获得嵌入式表示的低维目标矩阵。


2.根据权利要求1所述的图像分类方法,其特征在于,在步骤201中,邻接图G中每一个节点代表特征矩阵中的一个向量,计算节点之间的相似性,若两节点中一个节点是另一个节点的前k个相似性节点,则该两节点直接通过边连接;
在步骤202中,所述的加权随机游走模型是一种在邻接图上生成随机序列的方法,假如(xw1,xw2,…,xwl)是一个长度为l的...

【专利技术属性】
技术研发人员:汪祥李小勇王辉赞朱俊星邓科峰李金才张卫民任开军吴松唐波
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1