一种基于低秩表示和流形正则化的零样本分类方法技术

技术编号：19635696 阅读：192 留言：0更新日期：2018-12-01 16:19

本发明专利技术公开了一种基于低秩表示和流形正则化的零样本分类方法，包括：计算可见类数据集中样本的视觉特征与语义特征之间的映射关系；计算不可见类数据集中样本的语义表示；引入稀疏约束并结合拉普拉斯正则约束，计算不可见类数据集中样本的低秩表示；计算权重矩阵和拉普拉斯矩阵；引入流形正则化，去除不可见类数据集中语义表示的噪声；预测不可见类数据集中样本的标签，实现样本分类。本发明专利技术设计的基于低秩表示和流形正则化的零样本分类方法有效克服传统分类方法针对样本数量少、样本标签信息丢失等情况下分类精度低的局限性，获得不可见类数据集上更准确的语义表示，增强对数据特征的描述能力，能够有效地提高零样本分类的精度。

A Zero Sample Classification Method Based on Low Rank Representation and Manifold Regularization

The invention discloses a zero sample classification method based on low rank representation and manifold regularization, which includes: calculating the mapping relationship between visual features and semantic features of samples in visible data sets; calculating the semantic representation of samples in invisible data sets; introducing sparse constraints and combining Laplacian regularization constraints to calculate. The low-rank representation of samples in invisible datasets; the calculation of weight matrix and Laplace matrix; the introduction of Manifold Regularization to remove the noise of semantic representation in invisible datasets; the prediction of the label of samples in invisible datasets to achieve sample classification. The zero-sample classification method based on low rank representation and Manifold Regularization designed by the invention effectively overcomes the limitation of low classification accuracy of the traditional classification method in the case of small sample number and missing sample label information, obtains more accurate semantic representation on invisible class data sets, and enhances the description ability of data features. It can effectively improve the accuracy of zero sample classification.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于低秩表示和流形正则化的零样本分类方法
本专利技术涉及样本分类
，尤其涉及一种基于低秩表示和流形正则化的零样本分类方法。
技术介绍
在大规模的分类问题中，缺乏足够的训练样本，或许多样本的标签信息丢失，在一定程度上限制了分类精度的提高。零样本分类是针对这一问题提出的一种有效的解决方法。现有技术中通常假设样本数据都分布在低维的子空间中且具有低秩的结构。已有方法基于数据分布近似跨越多个低维子空间的假设，专注于寻找数据的低秩表示。它通过l1/l2范数处理离群点，并在一定的技术条件下精确的恢复了样本的子空间结构，同时检测出了离群点。然而当数据分布于联合非线性子空间时，这类方法无法精确地恢复数据的几何结构。在实际的应用中，人脸的面部图像就是位于非线性的流形结构中。在样本去噪方面，现有技术通常假设样本数据严格分布在流形中，然而在实际应用中，样本数据往往都存在噪声。在这种情况下，一些方法通过惩罚流形中局部或全局的结构来处理噪声问题，然而这种过度的惩罚通常会降低分类器的泛化能力，导致了当前在缺乏足够的训练样本或样本的标签信息丢失时，分类精度低的问题。
技术实现思路
本专利技术提供了一种基于低秩表示和流形正则化的零样本分类方法，解决了当前在缺乏足够的训练样本或样本的标签信息丢失时，分类精度低的技术问题。本专利技术提供的一种基于低秩表示和流形正则化的零样本分类方法，包括：步骤1：计算可见类数据集中样本的视觉特征Xs和语义表示As之间的映射关系f，即f:Xs→As，其中可见类数据集为为可见类数据集中样本的视觉特征，p是样本视觉特征的维度，为可见类数据集中样本的语义表示，q...

【技术保护点】
1.一种基于低秩表示和流形正则化的零样本分类方法，其特征在于，包括以下步骤：步骤1：计算可见类数据集中样本的视觉特征Xs和语义表示As之间的映射关系f，即f:Xs→As，其中可见类数据集为

【技术特征摘要】
1.一种基于低秩表示和流形正则化的零样本分类方法，其特征在于，包括以下步骤：步骤1：计算可见类数据集中样本的视觉特征Xs和语义表示As之间的映射关系f，即f:Xs→As，其中可见类数据集为为可见类数据集中样本的视觉特征，p是样本视觉特征的维度，为可见类数据集中样本的语义表示，q是每个样本对应语义表示的维度，cs为可见类数据集样本的类别总数，m为可见类数据集的样本总数；步骤2：利用映射关系f计算不可见类数据集中样本的语义表示Au，其中不可见类数据集为为不可见类数据集中样本的视觉特征且cu为不可见类数据集样本的类别总数，n为不可见类数据集的样本总数，为计算得到的不可见类数据集Xu的语义表示，步骤3：计算不可见类数据集中样本的拉普拉斯正则化的非负稀疏低秩表示Z；步骤4：利用低秩表示Z计算权重矩阵W和拉普拉斯矩阵L；步骤5：引入流形正则化，...

【专利技术属性】
技术研发人员：孟敏，詹箫玉，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人