The invention discloses an image classification method based on subspace projection and dictionary learning. First, the discriminant dictionary is initialized by training set samples with labels, and then the class labels of test samples are predicted by discriminant dictionary. A test set sample with high reliability is selected, and a low-dimensional subspace is learned from the test set sample with false labels and the discriminant dictionary is updated in this low-dimensional space. The test set samples are re-classified by the updated discriminant dictionary, and the pseudo labels obtained in this iteration are compared with those obtained in the previous iteration. The samples with the same pseudo label attributes obtained in the two iterations are called stable samples. If the number of stable samples exceeds 80% of the number of samples in the test set after the end of one iteration, the pseudo labels obtained in this iteration are output at the end of the iteration. Signature is the result of classification. Compared with the existing domain adaptive image classification methods, the algorithm of the present invention can achieve higher classification accuracy.
【技术实现步骤摘要】
一种基于子空间投影和字典学习的图像分类方法
本专利技术涉及到模式识别中的领域自适应图像分类领域,尤其涉及一种基于子空间投影和字典学习的域自适应图像分类领域。
技术介绍
在传统的模式识别和机器学习中,算法需要在一定的假设条件下才能有良好的表现,最常见的是:源域的训练集样本和目标域的测试集样本在分布上要保持一致。而在实际应用中,往往很难满足这个条件。例如:在图像分类领域,图像传感器的不同种类,拍摄角度的不同,不同的光线条件等,都会使训练集和测试集样本之间存在较大的分布差异。分布差异会导致训练好的分类器在实际处理测试集样本时表现不佳,大多数方法需要重新训练分类器,而训练分类器需要充足的带标签样本,在某些应用场景下,收集带标签的样本需要付出昂贵的代价甚至无法完成,领域自适应方法就致力于解决这个问题。解决领域自适应问题的其中一种方法是基于特征的自适应,在图像分类领域,一幅图像会通过各种各样的特征提取方法将其从像素矩阵转换为特征向量,面对图像分布不同带来的差异,这类方法从特征向量着手,通过子空间投影,特征变换等方式来减小图像分布差异给分类带来的影响。较有代表性的是杨蒙(音)教 ...
【技术保护点】
1.一种基于子空间投影和字典学习的图像分类方法,其特征在于:包含以下步骤:步骤1)使用带标签的训练集初始化判别字典并给测试集样本加上伪标签;步骤2)选出具有高可信度的测试集样本;步骤3)将高可信度的测试集样本和训练集样本分别投影到低维平面上,在低维平面上学习判别字典,同时联合学习投影矩阵;步骤4)使用学习到的判别字典再次对测试集样本进行分类,即重新加上伪标签;步骤5)计算稳定样本个数,若其数量大于等于测试集样本数量的80%则结束迭代过程,输出该轮伪标签作为结果;若小于80%则重复步骤2~5直到满足条件。
【技术特征摘要】
1.一种基于子空间投影和字典学习的图像分类方法,其特征在于:包含以下步骤:步骤1)使用带标签的训练集初始化判别字典并给测试集样本加上伪标签;步骤2)选出具有高可信度的测试集样本;步骤3)将高可信度的测试集样本和训练集样本分别投影到低维平面上,在低维平面上学习判别字典,同时联合学习投影矩阵;步骤4)使用学习到的判别字典再次对测试集样本进行分类,即重新加上伪标签;步骤5)计算稳定样本个数,若其数量大于等于测试集样本数量的80%则结束迭代过程,输出该轮伪标签作为结果;若小于80%则重复步骤2~5直到满足条件。2.根据权利要求1所述的基于子空间投影和字典学习的图像分类方法,其特征在于:所述步骤1)的详细步骤如下:假设给定的训练集中包含C类样本,即标签L={1,…,C},是训练集样本,是测试集样本,Ns,Nt分别是训练集和测试集样本的数量,n1,n2分别是训练集和测试集样本的特征维数;用表示第k轮的判别字典,表示第j类的子字典,其中n为低维子空间的维数,K是整个字典的原子数,X=[x1,…,xN]∈RK×N是N个样本由判别字典D的稀疏表示;||·||F指矩阵的Frobenius范数,即指矩阵各元素平方和开平方;||·||2是矩阵的2范数,即指该矩阵的协方差矩阵最大特征值开平方;步骤1.1)用带标签的训练集样本,通过线性判别字典学习的方法来初始化判别字典D(0),即通过最小化下式来使字典能够很好的使用原子线性表达出样本,并且能够通过稀疏表示系数X来对样本进行分类:其中对第i个样本Xin和Xout分别为步骤1.2)学习到字典D(1)后,给测试集样本加上伪标签,给第i个测试集样本加伪标签的方法如式(2):其中是使用第j类子字典重建第i个测试集样本的稀疏系数。3.根据权利要求2所述的基于子空间投影和字典学习的图像分类方法,其特征在于:所述步骤2)的详细步骤如下:由步骤1.2)给第i个测试集样本加上伪标签之后,通过计算每个训练集样本的置信度来衡量伪标签的可信度;在第k轮迭代过程中,第i个样本被分类到第j类的置信度由式(3)定义:即对第i个测试集样本,现得到长度为C的向量其值除了伪标签所属的项外都为零,即若共有C=5类,第i个样本伪标签为2,则其中为使用第k轮学习到的字典中的第j类子字典重建第i个测试集样本的重建误差,即在第k轮迭代学习到更新后的字典后,分别使用第j个子字典来重建第i个测试集样本,由式(4)给出:其中是将测试集样本投影到低维子空间的投影矩阵;为了得到伪标签可信度最大的Q%*Nt个测试集样本,以置信度为依据选择矩阵挑出所有类样本中可信度最大的前Q%个样本,W的每一个元素,即为零一变量,指出第i个样本在挑选第j类时是否被选中,若被选中则为1,否则为0,其中Q是一个固定常数,根据训练集大小而定,一般取50%:挑选第j类样本的方法如式(5):其中是第j类样本的选择矩阵,它是一个对角矩阵,其对角线上的元素为选择矩阵第j列的元素;同样地,也是对角矩阵,其对角线上的元素是置信度矩阵C(k)的第j列;||Wj(k)||0是Wj(k)矩阵中非零元素的个数,即确保每一类中只有Q%被选出;至此得到每一类的选择矩阵Wj(k),通过式(6)将选出的每一类高可信度样本加入字典的训练过程中,即更新用于下一轮训练的测试集样本:Yj(k+1)=[YtWj(k)],j=1,…,C(6)。4.根据权利要求1所述的基于子空间投影和字典学习的图像分类方法,其特征在于:所述步骤3)的详细步骤如下:步骤3.1)假设投影矩阵和n为投影后子空间的...
【专利技术属性】
技术研发人员:吴松松,邱宇峰,姚礼昕,荆晓远,岳东,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。