The invention discloses a sample classification method for semi-supervised dictionary learning based on atomic Laplacian regularization, which includes: S1: constructing a semi-supervised dictionary learning model based on atomic Laplacian regularization according to training samples; S2: adopting block coordinate descent algorithm to the semi-supervised dictionary learning model. Various variables are optimized until convergence; S3: According to the dictionary atomic label and sparse coding of unlabeled samples, the label vectors of test samples are reconstructed linearly, and the dimension with the largest element in the label vectors is selected as its category. The method regards dictionary atom as anchor point data of reconstructing training sample set to construct similarity matrix between dictionary atoms, so that more robust graph structure information can be obtained for abnormal samples, thus forcing unlabeled samples to participate in dictionary learning process more effectively and making the learning dictionary better. Sparse representation and classification.
【技术实现步骤摘要】
基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法
本专利技术涉及计算机模式识别和机器学习领域,特别是涉及一种基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法。
技术介绍
字典学习是利用普通稠密的训练样本学习一组过完备基(字典原子),从而获得输入样本在这些字典原子下的稀疏表达的过程,其广泛应用于图像处理方面,如图像恢复,图像压缩和图像分类等。简而言之,字典学习由稀疏表达和学习字典阶段两部分组成。因此,这导致学者可从字典的稀疏表示能力和分类判别能力两个角度来衡量学得字典的性能。字典的稀疏表示能力体现在能否用尽可能少的字典原子还原训练样本,而字典的分类判别能力则体现在各指定类的字典原子是否能够准确地判断出测试样本所属的类别。从字典的稀疏表示能力角度考虑,众多学者已经提出了各种不同的字典学习算法。例如Wright等人将训练样本作为基原子构建字典,对测试样本进行稀疏编码重构,进而提出了一种基于稀疏表示的分类(SRC)算法。该方法虽然在人脸分类方面取得了突破性的进步,但是由于其将所有训练样本作为字典基原子,导致字典规模太大,从而对后续的稀疏求解不利。为了能够获得自适应于训练样本集的字典,Engan等人提出了最优方向算法(MethodofOptimalDirections,MOD),它是一种在字典更新和稀疏编码之间交替迭代的优化过程。随后,Aharon和Elad等人提出了著名的K-SVD算法(广义的k-means),该方法能够同时更新字典和样本的稀疏表示系数,并能与任意一种匹配追踪算法,如FOCUSS,基追踪,匹配追踪等联合使用,这有利于实现字典对原 ...
【技术保护点】
1.一种基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法,其特征在于,所述方法包括:S1:根据训练样本构建基于原子拉普拉斯图正则化的半监督字典学习模型;S2:采用块坐标下降算法对所述的半监督字典学习模型中的各类变量进行优化,直到收敛;S3:根据所求解的字典原子标签以及无标签样本的稀疏编码,线性重构出测试样本的标签向量,并选取标签向量中元素最大的那个维度作为其所属的类别。
【技术特征摘要】
1.一种基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法,其特征在于,所述方法包括:S1:根据训练样本构建基于原子拉普拉斯图正则化的半监督字典学习模型;S2:采用块坐标下降算法对所述的半监督字典学习模型中的各类变量进行优化,直到收敛;S3:根据所求解的字典原子标签以及无标签样本的稀疏编码,线性重构出测试样本的标签向量,并选取标签向量中元素最大的那个维度作为其所属的类别。2.根据权利要求1所述的样本类别归类方法,其特征在于:所述的步骤S1包括以下子步骤:S11:运用字典原子的数据表征构建原子拉普拉斯图,即数据表征相关的原子具有相似的标签,数据表征不相关的原子的标签具有较大的差别;S12:根据字典原子的标签以及有标签样本的稀疏编码,线性重构出有标签样本的软标签,并用平方损失函数构建其与真实标签之间的重构误差;S13:将字典对样本的稀疏重构项、有标签样本的标签重构误差以及字典原子...
【专利技术属性】
技术研发人员:王迪,刘倩倩,张笑钦,古楠楠,叶修梓,
申请(专利权)人:温州大学苍南研究院,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。