一种基于可伸缩表示学习的图像分类方法技术

技术编号：28376125 阅读：14 留言：0更新日期：2021-05-08 00:03

本发明专利技术公开了一种基于可伸缩表示学习的图像分类方法，包括以下步骤：将图像表示为具有固定分辨率的矢量，获取图像集的特征矩阵M；将所述的特征矩阵输入到可伸缩表示学习过程中，获得低维目标矩阵；采用所述低维目标矩阵表示的训练集对KNN分类器进行训练；利用训练好的KNN分类器用于对待分类图像进行分类。本发明专利技术方法设计了可伸缩表示学习方法，该方法保留了数据的相似关系，可扩展且易于并行化，适用于大规模图像分类应用，实验表明，在大规模图像分类问题中本发明专利技术方法优于当前最好的矩阵表示学习方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于可伸缩表示学习的图像分类方法
本专利技术属于图像处理及识别领域，具体涉及一种基于可伸缩表示学习的图像分类方法。
技术介绍
在图像分类的机器学习和数据挖掘应用中，输入数据始终由冗余特征或噪声组成，这会对机器学习和数据挖掘方法的泛化能力产生负面影响。结果，许多实际的工作不得不用在数据预处理和数据转换过程方面，以将机器学习和数据挖掘有效地应用于实际问题中。众所周知，特征工程非常重要，但是需要大量的人工，这突出了从许多机器学习算法的数据中提取和组织区分性信息的弱点。为了解决该问题并提高数据质量，减轻维度问题的困扰并进一步减少存储量，开发数据表示学习方法非常重要。通常，在进行图像分类的机器学习任务有三种表示数据的学习方法：特征选择，降维和嵌入式表示表示学习。(1)特征选择涉及从所有可用变量中选择最佳变量集。典型的特征选择方法包括Relief，LasVegasWrapper等方法，其特征的种类严格限制功能的可用表示形式。(2)降维研究如何在保留最重要信息的同时缩小数据大小，有许多经典的线性和非线性降维算法，例如PCA(主成分分析)，LLE(局部线性嵌入)，SVD(奇异值分解)和LE(拉普拉斯特征图谱)。尽管这些方法在没有指定数据域的情况下适用于矩阵的低维表示，但是它们具有很高的计算和存储复杂性，并且难以应用于大规模数据的表示学习。例如，LLE和LE的计算复杂度均为O(n2)(与数据点的数量成正比)。(3)嵌入式表示学习旨在利用神经网络学习数据的信息表示。特别是，嵌入表示学习已在NLP网络和知识图等不同领域得到了广...

【技术保护点】
1.一种基于可伸缩表示学习的图像分类方法，其特征在于，包括以下步骤：/n步骤1，将图像表示为具有固定分辨率的矢量，获取图像集的特征矩阵M；/n步骤2，将所述的特征矩阵输入到可伸缩表示学习过程中，获得低维目标矩阵；/n步骤3，采用所述低维目标矩阵表示的训练集对KNN分类器进行训练；/n步骤4，利用训练好的KNN分类器用于对待分类图像进行分类；/n所述的步骤2中所述的可伸缩表示学习过程包括以下步骤：/n步骤201，根据所述的特征矩阵M中的向量成对相似性，构建邻接图G，特征矩阵中的向量构成邻接图的节点；/n步骤202，在邻接图G中利用加权随机游走模型生成邻接图中节点的上下文；/n步骤203，通过扩展skip-gram模型来学习嵌入表示，获得嵌入式表示的低维目标矩阵。/n

【技术特征摘要】
1.一种基于可伸缩表示学习的图像分类方法，其特征在于，包括以下步骤：
步骤1，将图像表示为具有固定分辨率的矢量，获取图像集的特征矩阵M；
步骤2，将所述的特征矩阵输入到可伸缩表示学习过程中，获得低维目标矩阵；
步骤3，采用所述低维目标矩阵表示的训练集对KNN分类器进行训练；
步骤4，利用训练好的KNN分类器用于对待分类图像进行分类；
所述的步骤2中所述的可伸缩表示学习过程包括以下步骤：
步骤201，根据所述的特征矩阵M中的向量成对相似性，构建邻接图G，特征矩阵中的向量构成邻接图的节点；
步骤202，在邻接图G中利用加权随机游走模型生成邻接图中节点的上下文；
步骤203，通过扩展skip-gram模型来学习嵌入表示，获得嵌入式表示的低维目标矩阵。

2.根据权利要求1所述的图像分类方法，其特征在于，在步骤201中，邻接图G中每一个节点代表特征矩阵中的一个向量，计算节点之间的相似性，若两节点中一个节点是另一个节点的前k个相似性节点，则该两节点直接通过边连接；
在步骤202中，所述的加权随机游走模型是一种在邻接图上生成随机序列的方法，假如(xw1,xw2,…,xwl)是一个长度为l的...

【专利技术属性】
技术研发人员：汪祥，李小勇，王辉赞，朱俊星，邓科峰，李金才，张卫民，任开军，吴松，唐波，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：湖南;43

全部详细技术资料下载我是这个专利的主人