一种小样本条件下的两阶段人脸图像分类方法及系统技术方案

技术编号:14265345 阅读:62 留言:0更新日期:2016-12-23 10:32
本发明专利技术公开了一种小样本条件下的两阶段人脸图像分类方法及系统,其中方法包括:样本扩充阶段,通过半监督的方式使人脸图像未标记样本对标记样本进行协同表示,获得协同表示系数;获取最大协同表示系数所对应的未标记样本;将最大协同表示系数所对应的未标记样本加入到标记子集中,对标记样本进行扩充,把扩充后的标记子集作为训练样本;同时将剩余的未标记样本作为新的未标记样本;人脸图像分类阶段,基于协同表示分类器使用扩充后的标记子集对样本扩充阶段得到的新的未标记样本进行分类,并得出最终的分类结果。本发明专利技术提高了监督分类方法的正确率,同时充分利用未标记样本的判定信息,使用样本扩充方式将半监督学习问题转化为监督学习问题。

【技术实现步骤摘要】

本专利技术涉及模式识别领域,更具体地说,涉及一种小样本条件下的两阶段人脸图像分类方法及系统
技术介绍
随着模式识别和计算机视觉技术的飞速发展,人脸识别由于其广泛的应用,得到很多来自各个领域研究者的关注,成为现代模式识别技术研究中的一个重要方面。然而,人脸识别在实际应用中是一个小样本问题,很多传统的人脸识别方法是基于大量训练样本前提的,因此在极度缺乏标记样本的情况下,大量的监督的识别方法受到限制,其识别能力会被弱化。目前主要采用的人脸识别方法包括KNN(k近邻)、LDA(线性判别分析)、SRC(稀疏表示分类器)、CRC(协同表示分类器)等。在欧式空间中,KNN是一种基于距离相似度进行分类的策略。它可以有效保持样本局部近邻之间的结构关系,但是,它对噪声很敏感,并依赖于欧氏距离。LDA作为一种有监督的分类方法,利用了标记信息,通过选择一个投影向量使同类的点经投影后尽可能靠近,不同类的点经投影后尽可能分散,从而实现分类功能。但是,LDA和KNN存在相同的缺点,就是它们无法实现对噪声的鲁棒性。考虑到对噪声的鲁棒性,已经出现了不少研究成果。SRC的思想是使用训练数据去线性稀疏重构测试样本,通过比较重构残差得到分类结果。由于稀疏方法在模式识别上的成功,因此其广泛在各个领域所使用。但是求解l1问题,需要耗费大量的时间,因此无法快速获取分类结果。最近有研究者提出CRC的方法进行分类,并可以快速获取最终的分类结果。但是SRC和CRC的分类效果依赖于训练样本的数量,因此在实际使用中无法满足小样本的条件。相对于难以获取的标记样本,大量的未标记样本简单易得,于是考虑到大量未标记样本中的判定信息,半监督的方法可以直接用来进行分类,但是如果直接使用半监督的分类策略,随着分类的进行,其分类误差会进行累加,这样会对最终的分类结果造成重大的影响。虽然已有上述多种人脸分类方法,但是,在实际分类人脸数据时,对于小样本分类问题,如何充分使用大量未标记样本的判定信息以及少量标记样本的语义信息还是比较难以实现的。因此,在小样本条件下对大量未标记样本进行分类,是目前研究的一个重点和难点。
技术实现思路
本专利技术的目的就是为了解决小样本条件下于大量未标记样本的分类问题,提供一种小样本条件下的两阶段人脸图像分类方法及系统,它具有结合半监督与监督的方法,在小样本的条件下实现有效的人脸图像分类的优点。为了实现上述目的,本专利技术采用如下技术方案:一种小样本条件下的两阶段人脸图像分类方法,步骤如下:样本扩充阶段,通过半监督的方式使人脸图像未标记样本对标记样本进行协同表示,获得协同表示系数;获取最大协同表示系数所对应的未标记样本;将最大协同表示系数所对应的未标记样本加入到标记子集中,对标记样本进行扩充,把扩充后的标记子集作为训练样本;同时将剩余的未标记样本作为新的未标记样本,保存到新的未标记子集中;人脸图像分类阶段,基于协同表示分类器使用扩充后的标记子集对样本扩充阶段得到的新的未标记子集中的新的未标记样本进行分类,并得出最终的分类结果。所述样本扩充阶段,将最大协同表示系数所对应的未标记样本加入到标记子集中,获取加入到标记子集中的未标记样本对应的标记,如果未标记样本所对应的标记为多个,则将标记为多个的未标记样本保存到新的未标记子集中。样本扩充阶段,包括以下步骤:步骤(1):获取人脸图像数据集,其中标记子集为Itrain,未标记子集为Utest,C为样本类别个数;步骤(2):分别对第i类的标记子集分别进行扩充,i的取值范围是1到C,对第i类的第j个标记样本使用未标记子集Utest获取对应的协同表示系数,获取最大的协同表示系数所对应的未标记样本并将最大协同表示系数所对应的未标记样本加入到标记子集Itrain中;同时将未标记子集Utest中最大协同表示系数所对应的未标记样本设置为全0;步骤(3):对步骤(2)进行迭代循环,直到标记子集Itrain的标记样本数量达到设定阈值时结束。所述步骤(3)中:在迭代循环过程中获取最大协同表示系数所对应的未标记样本的分类标签,对标签的数量进行判断,从而决定最大协同表示系数所对应的未标记样本是否放入标记子集Itrain中。所述对标签的数量进行判断,步骤为:如果未标记样本具有多个标签或者未被标记,则未标记样本被标记为Inf,被标记为Inf的样本放入未标记子集中,得到新的未标记子集Unew_test;如果未标记样本具有一个标签,则未标记样本直接加入到标记子集Itrain中,最后得到扩充的标记子集Inew_train。所述步骤(3)的设定阈值是未标记子集Utest的未标记样本数量的一半。人脸图像分类阶段,步骤如下:将扩充的标记子集Inew_train作为训练样本,新的未标记子集Unew_test为测试样本,使用Inew_train作为训练样本并利用基于协同表示的分类器对新的未标记子集Unew_test进行分类,得出最终的分类结果。所述基于协同表示的分类器如下: α i ^ = arg min α { | | I train j - U t e s t α i | | 2 + λ | | α i | | 2本文档来自技高网
...
一种小样本条件下的两阶段人脸图像分类方法及系统

【技术保护点】
一种小样本条件下的两阶段人脸图像分类方法,其特征是,步骤如下:样本扩充阶段,通过半监督的方式使人脸图像未标记样本对标记样本进行协同表示,获得协同表示系数;获取最大协同表示系数所对应的未标记样本;将最大协同表示系数所对应的未标记样本加入到标记子集中,对标记样本进行扩充,把扩充后的标记子集作为训练样本;同时将剩余的未标记样本作为新的未标记样本,保存到新的未标记子集中;人脸图像分类阶段,基于协同表示分类器使用扩充后的标记子集对样本扩充阶段得到的新的未标记子集中的新的未标记样本进行分类,并得出最终的分类结果。

【技术特征摘要】
1.一种小样本条件下的两阶段人脸图像分类方法,其特征是,步骤如下:样本扩充阶段,通过半监督的方式使人脸图像未标记样本对标记样本进行协同表示,获得协同表示系数;获取最大协同表示系数所对应的未标记样本;将最大协同表示系数所对应的未标记样本加入到标记子集中,对标记样本进行扩充,把扩充后的标记子集作为训练样本;同时将剩余的未标记样本作为新的未标记样本,保存到新的未标记子集中;人脸图像分类阶段,基于协同表示分类器使用扩充后的标记子集对样本扩充阶段得到的新的未标记子集中的新的未标记样本进行分类,并得出最终的分类结果。2.如权利要求1所述的方法,其特征是,所述样本扩充阶段,将最大协同表示系数所对应的未标记样本加入到标记子集中,获取加入到标记子集中的未标记样本对应的标记,如果未标记样本所对应的标记为多个,则将标记为多个的未标记样本保存到新的未标记子集中。3.如权利要求1所述的方法,其特征是,样本扩充阶段,包括以下步骤:步骤(1):获取人脸图像数据集,其中标记子集为Itrain,未标记子集为Utest,C为样本类别个数;步骤(2):分别对第i类的标记子集分别进行扩充,i的取值范围是1到C,对第i类的第j个标记样本使用未标记子集Utest获取对应的协同表示系数,获取最大的协同表示系数所对应的未标记样本并将最大协同表示系数所对应的未标记样本加入到标记子集Itrain中;同时将未标记子集Utest中最大协同表示系数所对应的未标记样本设置为全0;步骤(3):对步骤(2)进行迭代循环,直到标记子集Itrain的标记样本数量达到设定阈值时结束。4.如权利要求3所述的方法,其特征是,所述步骤(3)中:在迭代循环过程中获取最大协同表示系数所对应的未标记样本的分类标签,对标签的数量进行判断,从而决定最大协同表示系数所对应的未标记样本是否放入标记子集Itrain中。5.如权利要求4所述的方法,其特征是,所述对标签的数量进行判断,步骤为:如果未标记样本具有多个标签或者未被标记,则未标记样本被标记为Inf,被标记为Inf的样本放入未标记子集中,得到新的未标记子集Unew_test;如果未标记样本具有一个标签,则未标记样本直接加入到标记子集Itrain中,最后得到扩充的标记子集Inew_train。6.如权利要求1所述的方法,其特征是,人脸图像分类阶段,步骤如下:将扩充的标记子集Inew_train作为训练样本,新的未标记子集Unew_te...

【专利技术属性】
技术研发人员:张化祥董晓王强
申请(专利权)人:山东师范大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1