一种标签缺失情况下的低秩投影特征提取方法技术

技术编号：24458622 阅读：24 留言：0更新日期：2020-06-10 16:18

本发明专利技术公开了一种标签缺失情况下的低秩投影特征提取方法，所提方法逐一对样本数据和标签进行检测，获得当前样本和对应的标签。若当前样本标签属于正常范围，则继续检测下一个样本，若当前样本标签为缺失时，则计算每个样本在原始空间中距离该样本的欧氏距离，通过k近邻原则求得可能性最大的标签，并把对应于该样本的标签写入原始数据集中。在标签补偿后，构造最近邻图矩阵，通过PCA算法学习投影矩阵，并将投影矩阵应用到测试集上，用分类器执行归类。所提方法能够自适应地为各种归类模型提供更准确合理的训练数据，以帮助分类器生成更好的归类模型，提高图像分类的准确度和鲁棒性。

A low rank projection feature extraction method in case of label missing

全部详细技术资料下载

【技术实现步骤摘要】
一种标签缺失情况下的低秩投影特征提取方法
本专利技术涉及一种标签缺失情况下的低秩投影特征提取方法，特别是通过恢复标签来确保低秩投影特征提取的方法，属于机器视觉与模式识别领域。
技术介绍
图像分类常常需要对高维数据进行降维和特征提取以满足归类器的需要，而降维会引起信息丢失和能量降低的问题，典型的主元分析(PrincipalComponentAnalysis,PCA)算法是一种无监督分类投影学习算法，旨在从训练数据中学习一个最优的低秩投影矩阵，把学到的投影矩阵作用到训练集和测试集上，可以同时对训练集和测试集起到降维和提取特征的目的。利用PCA算法获得的投影矩阵可以在有效降维的同时保留绝大部分的能量，以提高特征提取的计算速度。而在学习投影矩阵中保持全局和局部结构对特征提取非常重要。低秩表示可以获取数据的全局结构性信息，能纠正误差并将所有样本分配到对应的子空间中，除此之外，低秩表示对噪声干扰更加鲁棒，可以区分噪声和有用信息。投影学习的最近邻图正则化因其在揭示数据的局部几何结构的优越性，被广泛应用于模式识别和机器视觉领域，使用该方法可以揭示样本数据的局部结构信息。k近邻准则通过某种距离度量找到样本周围最近的k个邻居，根据类别标签的多数原则，作为预测结果来确定样本所属标签。在图像分类领域，为了学习一个分类模型，往往需要对一个数据集分成训练集和测试集，分别用来学得模型和判断模型的优劣。因此除了样本本身的实际值数据以外，样本标签数据在产生归类模型的时候也是十分重要的。对于数据集而言，难免会出现少数样本标签缺失的情况。PCA算...

【技术保护点】
1.一种标签缺失情况下的低秩投影特征提取方法，对于样本容量为M、样本类别数为N的原始数据集，i表示当前第i个样本(0＜i≤M)的序号，x

【技术特征摘要】
1.一种标签缺失情况下的低秩投影特征提取方法，对于样本容量为M、样本类别数为N的原始数据集，i表示当前第i个样本(0＜i≤M)的序号，xi∈Rm×n表示第i个图像样本的数据矩阵，原始数据集X＝{x1，...，xi，...，xM}，初始化i＝1，所提方法包括以下六个步骤：
步骤一、预处理缺失的标签，读取第i个样本数据和标签，判断第i个样本的标签：若标签是正常值，则i＝i+1，此时当i＞M，跳到步骤四，否则继续步骤一；若标签缺失，则跳转步骤二；
步骤二、第i样本在原始空间中的点为xi，计算出xi点与其它样本点的欧氏距离表示xi中第l个m维向量；将求得的欧氏距离按从小到大的顺序进行排序，选取前k个欧氏距离，记为：Di，1、Di，2、…、Di，j、…、Di，k，(1≤...

【专利技术属性】
技术研发人员：沈港，刘浩，王凯巡，时庭庭，应晓清，魏国林，黄震，廖荣生，周健，魏冬，田伟，
申请(专利权)人：东华大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人